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计算 机 硬件 及 组 成 原理 


SE 
和 PC 机 的 神秘 面纱 ， 帮 助 读者 了 解 这 些 在 日 常生 活 中 已 经 无 处 不 在 的 复杂 机 器 。 书 中 解释 了 硬件 和 
软件 如 何 协同 作用 来 完成 现实 世界 中 的 各 项 任务 。 

与 其 他 类 似 简单 演示 如 何 设 计 计 算 机 硬件 的 图 书 不 同 ， 本 书 从 软件 开发 者 的 角度 出 发 ， 全 面 分 
析 了 整个 计算 机 ,重点 讲解 了 计算 机 的 优势 和 弱点 ， 解 释 了 如 何 处 理 存储 器 问题 ， 如 何 写 出 能 直接 
与 底层 硬件 交互 并 充分 利用 底层 硬件 的 高 效 汇编 代码 。 

此 外 ， 本 书 还 介绍 了 从 简单 的 能 入 式 应 用 的 8 位 微 处 理 器 转向 PC 和 工作 站 工作 时 应 如 何 进行 决 
策 ， 这 在 同类 图 书 中 独树一帜 。 同 时 ， 书 中 还 阐明 了 代码 行为 和 机 器 操作 之 间 的 联系 ， 以 帮助 读者 
更 好 地 理解 计算 机 在 速度 和 资源 方面 的 局 限 性 。 


本 书 特点 : 
@ 采用 目前 最 常见 的 三 种 计算 机 体系 结构 作为 示例 : Freescale 68000 、Intel i86 和 ARMv3， 
e 内 容 讲解 非常 直观 一 一 书 中 包含 多 种 简 图 和 图 表 ; 
@ 汇聚 作者 在 业界 多 年 的 实际 经 验 和 敏锐 的 洞察 力 。 


全 本 书 附带 光盘 内 容 包括 ; 
。 业界 多 位 知名 专家 关于 硬件 设计 和 开发 的 11 个 视频 讲座 ; 
。 课件 使 用 的 幻灯 片 ; 
。 三 种 示例 体系 结构 的 指令 系统 仿真 器 。 





作 是 华盛顿 - 波 泰 尔 【Washington-Bothell) 大 学 计算 和 软件 系统 
者 Arnold 2 Berger 系 的 高 级 讲师 ， 拥 有 康 奈 尔 大 学 的 学 士 和 博士 学 位 。Berger 博 
向 士 曾 担 任 Applied Microsystems 公 司 研发 部 门 的 主管 、Advanced Micro Devices 公 司 嵌 入 式 工具 的 营销 经 
介 | 理 和 惠普 公司 的 研发 项 目 经 理 。Berger 博 士 已 发 表 了 40 多 篇 关于 嵌入 式 系统 的 论文 ， 持 有 三 项 专利 ， 并 且 
是 畅销 书 《Embedded Systems Design: An Introduction to Processes, Tools and Techniques》 的 作者 。 
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本 书 从 软件 开发 者 角度 出 发 ， 详 细 介绍 了 现代 计算 机 体系 结构 ， 重 点 讲解 如 何 处 理 存储 器 问 
题 以 及 如 何 写 出 能 直接 与 底层 硬件 交互 并 充分 利用 底层 硬件 的 高 效 汇编 代码 。 
~ ”本 书 主要 讲述 硬件 基础 和 数字 化 设计 ， 涵 盖 现 代 计算 机 操作 系统 下 硬件 开发 的 各 种 元 素 ， 从 
汇编 语言 讨论 软件 设计 ， 从 宏观 角度 探讨 计算 机 体系 结构 ， 并 着 重 探 讨 了 CISC 和 RISC 两 种 微 处 
理 器 体系 结构 。 | 

本 书 适合 作为 高 等 院 校 相 关 专 业 课 程 教材 ， 也 可 供 软件 开发 人 员 参 考 。 
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机 械 工 业 出 版 社 华章 公司 本 着 为 服务 高 等 教育 的 出 版 原则 , 为 进一步 加 强 与 高 校 教师 的 联系 与 
沟通 ， 更 好 地 为 高 校 教师 服务 ， 特 制 此 表 ， 请 您 填 妥 后 发 回 给 我 们 ， 我 们 将 定期 向 您 寄 送 华章 公司 
最 新 的 图 书 出 版 信息 ， 为 您 的 教材 、 论 著 或 译 著 的 出 版 提供 可 能 的 帮助 。 欢 迎 您 对 我 们 的 教材 和 服 
务 提 出 宝贵 的 意见 ， 感 谢 您 的 大 力 支持 与 帮助 
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译 者 序 


展现 在 您 面前 的 是 这 样 一 本 书 : 它 讲 的 是 计算 机 硬件 和 体系 结构 的 问题 ， 而 且 也 确实 覆 
盖 了 这 个 领域 的 几乎 所 有 内 容 ， 但 是 ， 即 使 是 对 计算 机 硬件 知识 知之 甚 少 的 人 也 能 看 懂 它 并 
从 中 受益 。 因 为 本 书 是 从 软件 这 个 视角 来 介绍 计算 机 体系 结构 的 。 

一 个 软件 设计 者 ， 如 果 对 其 要 编程 的 硬件 和 体系 结构 的 知识 缺乏 了 解 ， 就 失去 了 很 多 
提高 软件 性 能 的 手段 。 然 而 ， 要 让 他 们 去 系统 地 学 习 计 算 机 体系 结构 的 知识 ， 再 运用 这 些 
知识 来 提高 软件 性 能 ， 则 存在 一 定 的 困难 。 因 为 现今 的 教科 书 大 都 是 针对 学 习 体系 结构 的 
人 而 编写 的 ， 所 以 这 些 教材 基本 上 都 是 力图 完整 系统 地 传授 体系 结构 知识 的 ， 并 没有 考虑 
一 个 软件 设计 者 如 何 利用 体系 结构 的 特点 设计 出 高 性 能 的 程序 。 也 就 是 说 ， 对 于 计算 机 体 
系 结构 ， 软 件 开发 者 在 掌握 知识 和 运用 知识 之 间 存 在 着 一 个 注 沟 ， 本 书 出 现 的 意义 就 是 填 
补 了 这 个 鸿沟 。 

本 书 的 讲授 风格 有 别 于 一 般 的 教科 书 ， 它 的 讲解 不 是 刻板 的 ， 而 是 以 一 种 轻松 和 该 谐 的 
口吻 进行 的 ， 就 像 课 堂 授课 录音 的 书面 记录 ， 读 者 可 以 自然 地 跟 进而 不 会 感到 疲倦 。 书 中 的 
内 容 丰 富 并 配 有 大 量 的 实例 ， 每 章 后 面 还 有 习题 并 提供 了 答案 (书后 和 网 上 )。 本 书 的 作者 具 
有 丰富 的 实践 经 验 和 教学 经 验 ， 读 者 在 阅读 本 书 的 过 程 中 随处 都 能 体会 到 。 

本 书 的 翻译 是 4 位 译 者 共同 努力 的 结果 ， 其 中 ， 吴 为 民 翻 译 了 序言 及 第 1、S3、6、7、9、 
12、15、16 章 ， 喻 文 健 翻译 了 第 2、3、4 章 ， 邓 潮 军 翻译 了 第 8、10、11 章 ， 伍 绍 贺 翻译 了 第 
13、14 章 。 最 后 由 吴 为 民 统一 校对 定稿 。 对 于 书 中 出 现 的 术语 ， 我 们 基本 是 按 最 常用 的 译 法 
和 具体 情况 进行 取舍 的 。 对 于 原 书 中 出 现 的 错误 ， 我 们 也 完全 按照 其 网 站 上 发 布 的 勘误 表 进 
行 了 改正 。 尽 管 如 此 ， 朴 漏 在 所 难免 ， 我 们 欢迎 和 感谢 来 自 读者 的 任何 批评 指正 。 


译 考 于 清华 园 
2007 年 1 月 
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谢谢 你 购买 我 的 书 。 我 希望 你 发 现 本 书 内 容 充 实 且 易 读 ， 至 少 ， 当 我 着 手写 这 本 书 时 ， 
这 是 我 的 目标 之 一 。 

本 书 是 我 一 直 在 Washington-Bothell 大 学 计算 与 软件 系统 系 所 教授 的 课程 的 成 果 。 该 课程 
(CSS 422) ， 即 “硬件 和 计算 机 组 成 ”(Hardware and Computer Organization) ， 是 我 系 本 科学 
生 必 修 的 核心 课程 之 一 ， 也 是 我 系 课 程 表 中 唯一 必修 的 体系 结构 课程 。 当 我 们 的 学 生 在 学 习 
算法 和 数据 结构 、 相 关 的 语言 、 数 值 方法 以 及 操作 系统 时 ， 这 是 他 们 唯一 一 次 接触 到 这 些 知 
识 外 壳 下 真实 的 原理 。 由 于 华盛顿 大 学 是 一 学 年 四 学 期 制 ， 所 以 我 就 面临 着 这 样 一 个 艰难 的 
挑战 : 要 在 10 周 左右 的 时 间 内 讲授 尽 可 能 多 的 计算 机 体系 结构 的 知识 。 

本 书 核 心 的 材料 是 用 5 年 多 的 时 间 制 成 的 大 约 500 张 Microsoft PowerPoint 幻 灯 片 。 后 来 ， 
我 将 幻灯 片 中 的 材料 转换 成 了 HTML， 这 样 我 就 也 能 通过 远程 教育 (DL) 的 形式 讲授 课程 了 。 
自从 1999 年 秋 首 次 讲授 该 课程 ， 我 每 个 学 年 都 要 讲 上 3~4 遍 。 我 还 通过 DL 讲授 了 3 次 ， 取 得 了 
很 好 的 效果 。 事 实 上 ，DL 学 生 在 总 体 上 与 在 课堂 听讲 的 学 生 做 得 一 样 好 ， 因 此 ， 如 果 你 觉得 
役 有 时 间 选 修 这 门 课 ， 那 么 可 以 用 本 书 来 自学 这 门 课 程 。 

本 书 适合 作为 从 二 年 级 到 四 年 级 中 在 计算 机 体系 结构 方面 的 第 一 门 课 。 本 书 相 当地 独立 ， 
所 以 应 该 能 成 为 计算 机 系 学 生 所 需 学 习 的 唯一 硬件 课程 ， 掌 握 了 这 门 课 程 就 能 理解 他 们 所 编 
写 的 代码 的 涵义 。 在 Washington-Bothell 大 学 (UWB)， 这 门 课程 主要 是 讲授 给 四 年 级 学 生 的 。 
作为 教员 我 们 发 现 ， 通 过 在 其 他 课程 中 学 习 编 程 概念 ， 达 到 一 定 的 熟练 程度 ， 有 助 于 学 生 轻 
松 地 转向 学 习 低 级 编程 技术 。 如 果 本 书 用 于 低 年 级 学 生 ， 就 需要 分 配额 外 的 时 间 来 熟练 掌握 
汇编 语言 的 编程 概念 。 例 如 : 在 介绍 某 些 汇编 语言 分 支 和 循环 结构 时 ， 高 年 级 学 生 很 容易 掌 
担 这 些 结构 与 WHILE、PDO-WHILE、FOR 及 IF-THEN-ELSE 结 构 的 相似 性 ， 但 低 年 级 学 生 则 
可 能 需要 更 多 具体 的 例子 来 领会 这 种 相似 性 。 

为 什么 要 写 一 本 关于 计算 机 体系 结构 的 书 ? 在 讲授 该 课程 的 5 年 多 时 间 中 ， 我 曾 4 次 更 换 
教材 。 在 学 期 末 ， 当 我 主持 一 个 非 正 式 的 课程 听取 学 生 汇 报时 ， 他 们 严厉 地 批评 了 我 使 用 过 
的 每 本 书 。 几 乎 每 个 计算 机 科学 系 的 学 生 在 体系 结构 课堂 上 使 用 的 标准 教材 都 与 他 们 的 需要 
无 关 。 这 些 学 生 中 的 绝 大 多 数 在 研究 生 阶 段 都 不 会 继续 学 习 体系 结构 ， 也 不 会 为 Intel 或 AMD 
设计 计算 机 。 因 此 ， 他 们 需要 的 是 理解 计算 机 体系 结构 及 其 支撑 硬件 ， 以 便于 编写 能 在 机 器 
上 运行 的 高 效 的 、 无 缺陷 的 代码 。 最 近 ， 我 确实 发 现 一 本 教材 ， 至 少 以 我 认为 应 该 的 方式 接 
近 了 主题 内 容 ， 但 是 我 发 现 该 教材 仍 在 几 个 关键 的 领域 存在 不 足 。 从 正面 看 ， 换 成 新 的 教材 
确实 能 消除 来 自学 生 的 抱怨 ， 同 时 也 强化 了 我 的 这 个 观点 ， 并 不 只 我 一 个 人 看 到 了 对 具有 不 
同 视角 的 教材 的 需求 。 遗 憾 的 是 ， 这 个 教材 尽管 是 一 个 重大 的 改进 ， 但 仍 没 有 涵盖 我 认为 非 
常 重要 的 几 个 领域 ， 因 此 我 下 决心 写 一 本 教材 ， 本 教材 确实 是 以 新 视角 写成 的 ， 且 没有 损失 
我 认为 的 精 休 。 . 

由 于 UMB 校 园 距 华 盛 顿 州 Redmond 的 微软 总 部 不 到 10 英 里 ， 所 以 我 们 受到 了 微软 文化 的 
强烈 影响 ， 这 并 不 奇怪 。 我 的 大 部 分 学 生 只 为 Windows 和 Intel 体 系 结构 写 程序 ， 该 体系 结构 
的 设计 者 会 让 你 相信 这 些 计算 机 是 无 限 快 的 机 器 ， 有 无 穷 的 资源 。 你 如 何 反 驶 这 种 观点 ? 





有 
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我 的 学 生 经 常 带 有 挫折 感 地 抱怨 ,， “为 什么 你 要 我 学 这 些 ? ”这 种 情况 通常 都 会 发 生 在 期 
中 考试 前 后 。 由 于 我 们 的 校园 与 波音 公司 建造 737、757 飞 机 的 地 点 华盛顿 州 Renton 和 建造 宽 
体 767、777 飞 机 的 地 点 华盛顿 州 Everett 大 致 等 距离 ， 用 飞机 工业 做 类 比 通 常 非常 有 效 ， 因 此 
我 用 这 个 例子 简单 地 回答 了 他 们 的 问题 ， “你 愿意 乘坐 一 个 由 某 个 对 飞行 原理 毫 无 所 知 的 人 设 
计 的 飞机 吗 ? ”有 时 这 种 反问 式 的 回答 会 很 奏效 。 

本 书 分 为 4 个 主要 的 主题 领域 : 

1. 硬件 和 异步 逻辑 介绍 。 

2. 同步 逻辑 、 状 态 机 和 存储 器 组 织 。 

3. 现代 计算 机 体系 结构 和 汇编 语言 编程 。 

4. 输入/ 输出、 计算 机 和 性能、 存储器 层次 ， 以 及 计算 机 组 成 的 未 来 发 展 方向 。 

这 些 主 题 领 域 之 间 没 有 明确 的 界限 划分 ， 而 且 后 面 章节 的 主题 材料 是 建立 在 前 面 章 节 的 
知识 基础 之 上 的 。 然 而 ， 我 已 力图 限制 这 种 相互 依赖 的 关系 ， 因 此 后 面 的 章节 可 以 根据 时 间 
和 教学 提纲 的 要 求 进行 取舍 。 

每 章 末 尾 都 有 一 些 习 题 ， 其 中 奇数 号 习题 的 答案 位 于 附录 中 ， 偶 数 号 习题 的 答案 则 可 通 
过 教师 资源 网 址 http://textbooks.elsevier.com/0750678860 得 到 。 

我 们 在 课本 中 采取 了 由 下 而 上 的 方法 描述 硬件 。 正 如 遗传 学 家 用 仅 包含 腺 嗓 叭 、 胞 喀 啶 、 
鸟 嗓 叭 、 胸 腺 旷 啶 〈 分 别 简 写 为 A、C、G、T) 4 种 核 苷 酸 的 DNA 分 子 就 能 描述 最 复杂 的 有 机 
生命 一 样 ， 我 们 用 与 门 (AND)、 或 门 (OR) 、 非 门 (NOT)、 三 态 门 (TRI-STATE) 这 4 种 逻 
辑 构 件 块 就 能 描述 最 复杂 的 计算 机 或 存储 系统 。 严 格 地 说 ， 三 态 门 不 是 一 个 类 似 于 与 门 的 遥 
辑 构件 块 ， 它 更 像 “ 粘 结 剂 ”， 使 我 们 能 以 某 种 方式 将 计算 机 元 件 互 连 ， 从 而 避免 过 高 的 复杂 
性 。 而 且 ， 我 确实 喜欢 DNA 这 个 类 比 ， 所 以 我 们 需要 用 4 个 电子 构件 块 与 A、C、G、T 相 类 比 。 

我 曾经 给 一 组 中 学 教师 做 过 一 个 报告 ， 这 些 教师 那 时 正 努 力 地 想 在 夏季 休息 期 间 修一 些 
在 职 学 分 。 当 我 为 惠普 公司 的 逻辑 系统 部 门 工 作 时 ， 我 还 是 位 于 科罗拉多 Springs 的 空军 学 院 
校区 的 志愿 者 。 这 些 教师 中 没有 一 个 懂 计 算 机 ， 我 要 用 两 个 小 时 教 给 他 们 这 门 技术 的 一 些 感 
性 知识 。 我 决定 从 亚 里 士 多 德 和 作为 哲学 分 支 的 逻辑 操作 符 开 始 讲解 ， 然 后 用 DNA 做 类 比 继 
续 介绍 寄存 器 概念 。 我 似乎 正 逐 渐 让 他 们 听 懂 ， 但 他 们 却 总 在 打击 我 的 自信 心 ， 使 我 想 在 他 
们 的 点 名 册 上 签字 解约 。 无 论 如 何 ， 我 认为 表明 这 样 的 事实 是 有 价值 的 : 即使 是 最 复杂 的 计 
算 机 功能 ， 也 能 用 我 们 在 本 书 第 一 部 分 所 介绍 的 基本 膛 辑 单元 来 描述 。 

我 们 将 采用 DNA 或 构件 块 方法 贯穿 于 本 书 前 半 部 分 中 的 大 部 分 。 我 们 将 从 最 简单 的 门 开 
始 ， 构 建 复合 门 ， 再 从 这 些 复合 门 开 始 ， 进 一 步 提 出 和 求解 异步 逻辑 方程 。 我 们 将 学 习 用 布 
尔 代数 和 卡 诺 图 (Karnaugh Map, K-map) 进行 真 值 表 设 计 和 化 简 的 方法 。 习 题 和 实例 强调 的 
是 将 问题 用 一 组 规范 化 描述 来 陈述 ， 然 后 转化 为 一 个 真 值 表 ， 再 由 真 值 表 转化 为 卡 诺 图 ， 最 
后 转化 为 门 设计 。 此 时 ， 要 鼓励 学 生 使 用 随 书 带 的 DVD 光盘 中 的 Digital Works 软 件 模拟 器 
( 见 下 文 ) 在 模拟 中 实际 地 “构建 ”电路 。 我 发 现 这 种 把 抽象 设计 和 实际 模拟 相 结合 是 一 个 极 
好 的 教学 方法 。 

采用 这 个 方法 的 好 处 之 一 是 能 使 学 生 们 逐渐 习惯 于 在 二 进 制 位 一 级 和 变量 打交道 。 虽 然 
大 多 数学 生 熟 悉 C/C++ 的 布尔 结构 ， 但 是 一 条 承载 一 个 变量 状态 的 线 对 他 们 来 说 还 是 相当 新 
的 概念 。 

介绍 了 建立 任意 复杂 的 异步 代数 函数 的 思想 之 后 ， 我 们 就 加 入 时 钟 和 同步 逻辑 的 概念 。 
同步 逻辑 包括 触发 器 、 计 数 器 、 移 位 器 、 寄 存 器 以 及 状态 机 。 我 们 在 该 领域 实际 付出 了 很 多 
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努力 ， 在 稍 后 讲 到 微 代码 和 指令 分 解 时 ， 还 要 将 这 些 概念 重新 介绍 几 次 。 

本 书 的 中 间 部 分 着 重 介绍 计算 机 系统 的 体系 结构 。 尤 其 是 ， 我 们 会 非常 关注 存储 器 到 
CPU 的 接口 。 我 们 将 利用 在 前 面 章节 学 到 的 知识 设计 简单 的 存储 器 系统 和 译 码 电路 。 我 们 还 
简要 考察 了 存储 器 定时 ， 以 便于 更 好 地 理解 系统 设计 的 一 些 更 全 局 化 的 问题 。 


接 下 来 我 们 将 转 而 介绍 68K、ARM 以 及 x86 处 理 器 系列 的 体系 结构 ， 这 同时 也 将 是 对 汇编 
语言 编程 的 介绍 。 


每 种 处 理 器 体系 结构 都 单独 讲解 ， 以 使 读者 可 跳 过 某 种 结构 的 介绍 而 不 会 产生 过 多 的 不 


连贯 性 。 
本 书 确实 在 三 个 体系 结构 中 都 强调 了 汇编 语言 编程 ， 其 原因 有 两 个 方面 : 首先 ， 汇 编 语 
言 不 一 定 是 作为 课程 表 的 一 部 分 为 计算 机 科学 系 学 生 讲 授 的 ， 故 这 可 能 是 他 们 在 机 器 级 接触 
编程 的 唯一 机 会 。 即 使 你 作为 计算 机 系 的 学 生 可 能 从 不 需要 编写 汇编 语言 程序 ， 你 也 很 有 可 
能 要 在 汇编 语言 级 来 调试 C++ 程序 的 某 些 部 分 ， 因 此 ， 这 是 一 个 很 好 的 学 习 机 会 。 而 且 ， 通 
过 考察 这 三 个 截然 不 同 的 指令 集 ， 我 们 将 实际 强化 这 种 观念 : 一 旦 你 理解 了 一 种 处 理 器 的 体 
系 结构 ， 你 就 能 用 汇编 语言 对 其 进行 编程 ， 这 就 引出 了 学 习 汇编 语言 的 第 二 个 原因 。 汇 编 语 
言 是 从 软件 开发 者 的 角度 学 习 计 算 机 体系 结构 的 一 个 很 好 的 出 发 点 。 
我 是 “ 赛 博 士 ”(Dr. Science) 的 一 个 狂热 爱好 者 ， 他 经 常 出 现在 国家 无 线 广播 电台 中 ， 
并 在 大 学 校园 中 巡回 演讲 ， 他 的 著名 时 艇 语 是 :“ 我 在 某 某 学 科 具 有 硕士 学 位 。” 不 过 ， 我 在 
赛 博士 的 讲座 上 听 到 这 样 一 句 话 :“ 我 喜欢 审视 一 列 列 的 随机 数字 ， 并 从 中 发 现 模式 。” 我 记 
住 了 这 句 话 ， 并 经 常用 在 我 的 课堂 上 ， 以 描述 如 何 能 够 通过 看 起 来 很 随机 的 机 器 语言 指令 集 
来 逐渐 领会 计算 机 体系 结构 。 我 只 能 想像 一 群 摩 托 罗 拉 的 CPU 设计 师 和 工程 师 围 坐 在 餐馆 的 
桌 旁 ， 桌 子 上 的 比萨 饼 盘 子 散 布 在 各 处 ， 他 们 正 试图 为 最 后 几 条 指令 计算 出 正确 的 位 模式 ， 
以 避免 得 到 一 个 膨胀 的 、 无 效率 的 微 代码 ROM 表 。 如 果 你 是 一 个 学 生 ， 并 且 读 到 这 里 还 没有 
任何 感觉 ， 那么 也 不 要 着 急 。 
本 书 最 后 一 部 分 又 返回 来 重新 考察 了 计算 机 体系 结构 的 一 般 问题 。 我 们 将 考察 CISC 与 
RISC， 以 及 诸如 流水 线 、 高 速 缓存 、 虚 拟 存 储 器 和 存储 器 管理 等 这 些 现代 技术 。 然 而 ， 最 重 
要 的 主题 还 是 计算 机 性 能 ， 我 们 将 不 断 地 返回 到 有 关 软 件 到 硬件 接口 、 编 码 方法 和 硬件 之 间 
的 相互 影响 等 问题 上 来 。 
本 书 的 一 个 独特 之 处 在 于 随 书 所 附 的 DVD 光盘 中 的 材料 ， 其 中 包含 了 下 列 程序 ， 用 来 与 
本 书 配合 使 用 : 
。 Digital Works (免费 软件 ); 一 个 硬件 设计 和 模拟 工具 。 
。 Easy68K : 一 个 汇编 器 /模拟 器 /调试 器 免费 软件 包 ， 用 于 摩托 罗拉 (现在 免费 级 别 的 ) 
68 000 体 系 结 构 。 

。x86emul: 一 个 汇编 器 /模拟 器 /调试 器 共享 软件 包 ， 用 于 x86 体 系 结构 。 

。GNU ARM 工具: ARM 开发 者 工具 箱 ， 带 有 来 自 自 由 软件 基金 会 (Free Software 
Foundation) 的 指令 集 模拟 器 。 

。 来 自 11 位 业界 专家 的 关于 硬件 设计 和 开发 方面 重要 主题 的 视频 讲座 。 

ARM 公 司 有 一 个 极 好 的 工具 套件 ， 你 可 直接 从 ARM 获 得 。 它 带 有 一 个 免费 45 天 的 评估 许 
可 证 ， 这 对 于 我 们 的 课程 来 讲 应 该 足够 用 了 。 遗 憾 的 是 ， 我 未 能 通过 谈判 与 ARM 公 司 达 成 一 
个 许可 证 协议 ， 使 我 能 将 这 些 ARM 工 具 包 含 在 随 书 的 DVD 光盘 中 。 该 工具 套件 极为 优秀 和 易 
用 。 如 果 你 想 花 费 一 些 额 外 的 时 间 来 考察 世界 上 最 流行 的 RISC 体 系 结构 ， 那 么 就 直接 和 ARM 
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公司 联系 ， 友 好 地 寻求 ARM 人 套件 的 拷贝 吧 。 告 诉 他 们 是 我 让 你 这 样 做 的 。 

我 还 在 CSS 422 课 上 广泛 地 采用 了 Easy68K 汇 编 器 /模拟 器 。 它 性 能 良好 ， 并 附 有 很 多 调试 
功能 。 而 且 ， 由 于 它 是 免费 软件 ， 所 以 无 需 考 虑 许可 证 和 评估 期 限 这 些 后 顾 之 忧 。 然 而 ， 我 
们 还 要 对 本 书 中 的 其 他 工具 做 一 些 引用 ， 因 此 ， 最 好 在 你 打算 使 用 时 再 安装 它们 ， 而 不 是 在 
课程 开始 时 就 安装 它们 ， 这 也 许 是 一 个 好 主意 。 

DVD 光盘 包括 的 11 个 视频 讲座 ， 内 容 与 本 书 各 种 主题 相关 ， 演 讲 者 来 自 于 计算 机 体系 结 
构 领域 的 专家 。 这 些 视频 文件 是 在 2004 年 UWB 的 沃 辛 顿 技 术 捐 赠 基金 提供 的 资助 下 制作 的 。 
每 个 讲座 都 是 15 到 30 分 钟 的 技术 讲解 。 我 希望 你 花 时 间 看 一 下 ， 并 将 它们 融 汇 到 相关 主题 的 
学 习 过 程 中 。 

虽然 编辑 、 我 的 学 生 们 以 及 我 本 人 都 已 将 本 书 读 过 几 遍 了 ， 但 据 墨 菲 法 则 的 预言 ， 本 书 
还 有 存在 错误 的 巨大 可 能 性 ， 因 为 毕竟 它 是 软件 。 因 此 ， 如 果 你 在 本 书 中 看 到 错误 ， 那 么 请 
告诉 我 ， 并 将 你 的 意见 发 送 到 : aberger@u.washington.edu。 我 将 保证 这 些 修正 意见 能 在 我 的 
华盛顿 大 学 的 网 站 (http://faculty.uwb.edu/aberger) 上 张贴 出 来 。 

最 后 一 点 我 想 说 的 是 ， 课 本 只 能 做 到 这 样 。 无 论 你 是 正在 读本 书 的 学 生还 是 老师 ， 请 尽 
量 寻 找 专家 和 原始 资源 。James Patterson 教 授 在 2004 年 7 月 期 的 《Physics Today》 (今日 物理 ) 
中 写 到 : 

当 我 们 想 了 解 菜 件 事物 时 ， 总 有 一 种 想 在 课本 中 快速 寻求 答案 的 倾向 。 这 常常 是 奏效 的 ， 
但 我 们 需要 养 成 查看 原始 论文 的 习惯 。 因 为 课本 上 的 内 容 通常 是 把 事实 经 过 二 次 或 三 次 简化 


让 我 们 开始 吧 。 


Arnold S. Berger 
Sammamish, 华盛顿 
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第 1 章 硬件 体系 结构 简介 


学 习 目 标 

。 描述 计算 器 件 的 演化 以 及 大 多 数 计算 机 器 件 的 组 织 方式 ; 

。 在 二 进 制 、 八 进 制 、 十 六 进 制 数 之 间 做 简单 的 转换 ， 并 解释 这 些 数 制 对 计算 器 件 的 重 
要 性 ， 

。 表明 计算 机 硬件 的 原子 元 件 和 逻辑 门 的 使 用 方式 ， 并 详 述 支配 它们 操作 的 规则 。 


1.1 引言 


今天 ， 当 一 排 计 算 机 围绕 在 我 们 周围 帮助 我 们 管理 日 常生 活 时 ， 我 们 通常 会 视 这 些 为 理 
所 当然 。 对 于 正在 学 习 计算 机 体系 结构 和 数字 硬件 的 你 来 说 无 疑 是 很 好 的 理解 并 习以为常 ， 
而 且 你 可 能 在 个 人 计算 机 和 工作 站 上 已 编写 了 数 不 清 的 程序 ， 计 算 机 技术 已 经 进展 到 如 此 程 
度 ， 即 每 个 任天堂 GameBoy 游 戏 机 的 计算 能 力 都 百倍 于 用 于 首次 执行 水 星 太空 任务 的 计算 机 
系统 。 


1.2 计算 技术 简 史 


计算 机 器 自 出 现 已 经 历 了 漫长 的 几 百 年 的 时 光 。 中 国 算 盘 、 带 有 传动 装置 和 齿轮 的 计算 
器 以 及 第 一 台 模 拟 计 算 机 都 是 计算 机 器 的 例子 。 我 们 将 要 介绍 的 计算 机 器 产生 于 20 世 纪 40 年 
代 ， 因 为 第 二 次 世界 大 战 中 的 炮兵 需要 一 种 更 精确 的 方法 来 计算 从 战舰 上 发 射 炮弹 的 轨迹 。 

今天 ， 计 算 机 变 得 如 此 普遍 流行 的 主要 原因 是 集成 电路 制造 技术 的 进步 。 在 加 利 福 尼 亚 
的 San Jose 北 部 和 Palo Alto 南 部 ， 曾 经 主要 以 橘 林 闻 名 的 地 方 如 今 已 被 称 为 硅谷 。 硅 谷 是 很 多 
公司 的 大 本 营 ， 而 这 些 公司 正 是 集成 电路 技术 的 推动 者 。Intel、AMD、Cypress、Cirrus 
Logic 等 等 这 些 名字 都 在 全 世界 家 喻 户 晓 。 

大 约 30 年 前 ，Intel 的 创始 人 之 一 Gordon Moore 观 察 到 ， 安 置 于 单个 硅 芯 片上 的 唱 体 管 密 
度 每 18 个 月 翻 一 番 。 该 论点 自从 Moore 首 次 指出 以 来 一 直 相当 准确 ， 并 被 公认 为 摩尔 定律 。 与 
其 他 指标 相 比 ， 存 储 器 容量 更 适 于 用 作 说 明 摩尔 定律 准确 性 的 例子 。 图 1-1 是 存储 器 容量 对 于 
时 间 的 半 对 数 图 。 很 多 电路 设计 者 和 器 件 物理 学 家 还 在 争论 摩尔 定律 持续 下 去 的 可 能 性 。 晶 
体 管 不 能 无 限 地 缩小 ， 要 生产 如 此 小 尺寸 的 硅 圆 片 ， 制 造 者 也 负担 不 起 制造 设备 的 成 本 。 在 
某 个 点 上 ， 量 子 物理 学 定律 将 开始 深刻 地 改变 这 些微 小 晶体 管 的 特性 。 

今天 ， 我 们 能 够 将 数 以 亿 记 的 晶体 管 ( 即 我 们 用 来 建造 你 辑 门 的 “活动 ”开关 器 件 ) 安 
置 在 单个 硅 片 上 ， 边 长 大 概 为 2czm。 从 设计 计算 机 芯片 的 角度 看 ， 这 个 重大 突破 发 生 在 Mead 
和 Conway 描述 了 一 种 通过 编写 软件 产生 硬件 设计 的 方法 之 后 。 这 个 称 为 硅 编译 (silicon 
compilation) 的 方法 导致 了 硬件 描述 语言 (hardware description language, HDL) 的 产生 。 硬 
件 描述 语言 如 Verilog 和 VHDL 能 够 使 硬件 设计 者 编写 出 与 C 程 序 设 计 语 言 极 其 相似 的 程序 ， 然 
后 将 该 程序 编译 成 一 个 处 方 〈recipe) ， 半 导体 制造 者 就 用 该 处 方 制造 芯片 。 

回 到 开始 。 第 一 代 计算 机 的 引擎 由 机 械 装置 组 成 。 算 盘 、 加 法 机 、 纺 织 机 穿孔 卡 读 卡 器 属 
于 这 一 类 。 第 二 代 跨 越 了 1940~1960 年 这 段 时 期 。 这 个 时 期 用 电子 器 件 〈 即 真空 管 ) 作为 活动 


2 获 了 章 
器 件 或 开关 元 件 。 即使 一 个 微型 的 真空 管 也 比 硅 圆 片上 的 一 个 晶体 管 大 几 百 万 倍 ， 其 消耗 的 功 
率 是 晶体 管 的 几 百 万 倍 ， 而 其 使 用 寿命 则 比 晶 体 管 小 几 百 倍 或 几 千 倍 。 虽然 真空 管 计 算 机 比 前 
一 代 的 机 械 计 算 机 快 得 多 ， 但 仍 比 现在 的 计算 机 慢 几 千 倍 。 如 果 你 是 20 世 纪 50 年 代 B 级 科幻 小 
说 改编 电影 的 爱好 者 ， 这 些 计算 机 就 是 那些 充满 房间 ， 身 上 灯光 闪烁 ， 仪表 针 跳 动 的 东西 。 


冯 对 序 区 
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图 1-1 动态 随机 存储 器 (DRAM) 的 容量 随时 间 的 增长 。 注 意 其 半 对 数 行为 ， 表 明了 摩尔 定律 


第 三 代 大 致 是 从 1960 年 到 1968 年 这 段 时 期 。 这 个 时 期 ， 晶 体 管 取代 了 真空 管 ， 计算 机 突 
然 开始 有 能 力 做 实际 工作 了 。 诸 如 IBM、Burroughs、 Univac 这 样 的 公司 都 建造 了 大 型 机 ， 
IBM 360 系 列 就 是 当时 大 型 机 的 典型 例子 。 当 时 ，Xerox 的 研究 者 也 在 他 们 的 Palo Alto 研 究 中 
心 (Xerox PARC) 进行 一 些 关 于 人 机 接口 方面 的 开创 性 工作 。 在 那里 ， 他 们 的 研究 成 果 后 来 
演变 成 为 计算 机 网 络 、Windows 操 作 系统 以 及 广泛 使 用 的 鼠标 。 程序 员 们 不 再 用 机 器 语言 
汇编 语言 编程 ， 而 是 开始 使 用 FORTRAN、 COBOL 和 BASIC 。 

第 四 代 大 致 是 从 1969 年 到 1977 年 ， 是 小 型 计算 机 的 时 代 。 小 型 计算 机 是 大 众 化 的 计算 机 ， 
它 虽 然 还 不 完全 是 个 人 计算 机 ， 但 它 已 将 计算 机 搬出 了 由 穿 白 外 套 的 技术 人 员 维护 的 计算 机 
房 的 消毒 环境 ， 搬 进 了 我 们 的 实验 室 。 小 型 计算 机 还 象征 着 集成 电路 ( 即 单一 封装 的 逻辑 函 
数 集 块 ) 的 出 现 ， 它 替代 了 诸如 晶体 管 、 电 阻 这 样 布 置 于 印刷 电路 板 上 的 单个 电子 零件 〈 称 
为 分 立 器 件 ) 。 这 段 时 期 出 现 了 小 规模 和 中 规模 的 集成 电路 。 诸如 数据 设备 公司 (DEC ) 、 
Data General 以 及 HP 这 样 的 公司 都 建造 了 这 一 代 的 小 型 计算 机 ?。 在 这 段 时 期 中 ， 还 提出 了 简 
单 的 集成 电路 微 处 理 器 ， 并 由 Intel、Texas Instruments、Motorola、 MOS Technology 以 及 
Zilog 等 公司 将 其 商品 化 。 早 期 最 能 代表 这 一 代 的 微 计算 机 器 件 是 Intel 的 4004、8008 和 8080， 
Texas Instruments 的 9900， 以 及 Motorola 的 6800。 第 四 代 的 计算 机 语言 是 : 汇编 、C、Pascal、 
Modula、 Smalltalk 和 Microsoft BASIC 。 

我 们 目前 处 于 第 五 代 ， 虽 然 有 和 争论 认为 第 五 代 结束 于 Intel 80486 微 处 理 器 ， 奔 腾 
(Pentium) 代表 第 六 代 ， 但 我 们 将 忽视 这 个 不 同意 见 ， 直 至 它 被 更 广泛 地 接受 。 半 导体 制造 
技术 的 进步 是 对 第 五 代 计 算 机 特色 的 最 佳 刻画 ， 当今 半导体 工艺 代表 了 称 为 超大 规模 集成 电 
路 (Very Large Scale Integration, VLSI) 的 技术 。 下 一 步 ， 甚 大 规模 集成 电路 (Ultra Large 
Scale Integration, ULSI) 既 非 就 在 眼前 ， 也 不 是 即将 来 临 。AMD 研 究 员 (Fellow) Daniel 
Mann 博 士 ? 最 近 告 诉 我 ， 现 代 AMD Athlon XP 处 理 器 包含 将 近 6 千 万 个 晶体 管 。 
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第 五 代 还 见证 了 个 人 计算 机 和 操作 系统 的 成 长 ， 后 者 还 是 该 种 机 器 的 焦点 。 由 标准 操作 
系统 控制 的 标准 硬件 平台 使 数 以 千 计 的 开发 者 为 这 些 系统 编写 程序 。 就 软件 而 论 ， 占 支配 地 
位 的 语言 变 为 ADA、C++、Java、HTML 和 XML。 此 外 ， 基 于 通用 建 模 语言 (UML) 的 图 形 
设计 语言 开始 出 现 。 


对 当前 计算 机 的 两 种 观点 


现代 计算 机 已 变 得 更 快 、 更 强 
大 ,但 是 在 很 多 年 里 计算 机 的 基本 
体系 结构 本 质 上 未 变 。 现 今 我 们 可 
以 对 这 种 机 器 持 两 种 等 价 的 观点 : 
硬件 观点 和 软件 观点 。 毫 不 奇怪 ， 
硬件 观点 关注 的 是 机 器 ， 并 确实 考 
虑 到 软件 与 其 存在 的 这 种 前 提 相 
关 。 从 5 万 英尺 远 ， 我 们 的 计算 机 
看 起 来 如 同 图 1-2 所 示 。 

在 本 课程 中 ,我 们 将 主要 关注 
CPU 和 存储 器 系统 ， 并 少许 考虑 驱 
动 硬件 的 软件 。 我 们 将 略微 谈 及 
IO ， 因 为 IO 对 于 好 的 计算 机 来 说 
是 不 可 缺少 的 

软件 开发 者 的 观点 大 致 等 价 ， 
但 其 视角 却 有 所 变化 。 图 1-3 从 软件 
开发 者 的 视角 描述 了 计算 机 。 注 意 
图 中 显示 的 对 系统 的 观察 有 点 问 
题 ， 因 为 用 户 接 口 与 应 用 程序 的 直 
接 通信 并 不 总 是 清楚 的 ， 在 很 多 情 
况 下 ， 用 户 接口 首先 与 操作 系统 通 
信 。 然 而 ， 我们 可 以 用 稍微 宽松 的 
眼光 来 看 待 该 图 ， 将 其 看 成 信息 流 ， 


而 不 是 控制 流 。 图 1-3 根据 系统 的 抽象 级 别 表示 计算 机 
抽象 级 别 


关于 计算 机 设计 ， 一 个 更 现代 的 概念 是 抽象 级 别 的 思想 。 每 个 级 别提 供 的 是 它 下 面 级 别 
的 抽象 ， 位 于 最 低级 别 的 就 是 硬件 。 为 了 控制 硬件 ， 就 有 必要 生成 一 些小 的 ， 称 为 驱动 程序 
(driver) 的 程序 ， 用 来 实际 操纵 硬件 的 各 个 控制 位 。 
位 于 驱动 程序 上 面 的 是 操作 系统 和 其 他 系统 程序 。 操 作 系 统 (OS) 通过 一 组 标准 的 应 用 
pi (Application Programming Interface, API) 与 驱动 程序 通信 。API 提 供 了 一 种 结构 ， 
通过 它 ， 抽 象 级 别 中 的 上 一 级 别 可 与 下 一 级 别 通信 。 这 样 ， 为 了 从 计算 机 的 键盘 读 一 个 字符 ， 
就 要 有 一 个 低级 别 的 驱动 程序 ， 当 一 个 按键 被 融 击 时 ， 激活 该 驱动 程序 。 操 作 系 统 通过 其 API 
与 该 驱动 程序 通信 。 
在 接 下 来 的 级 别 中 , 应 用 软件 通过 系统 API 与 操作 系统 通信 , 这 又 是 一 个 对 较 低 级 别 的 抽象 ， 


图 1-2 计算 机 的 抽象 观察 。 三 个 主要 的 要 素 是 : 控制 和 数据 处 
理 器 、 输 入 和 输出 〈 即 IO 器 件 ) 以 及 运行 于 机 器 上 的 程序 
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使 得 硬件 和 驱动 程序 在 行为 上 的 个 体 差异 可 以 被 忽略 。 然 而 ， 我 们 需要 稍 加 注意 ， 不 要 对 图 1-3 
的 观点 理解 得 过 于 字面 化 。 我 们 还 可 以 争辩 说 ， 应 用 程序 和 操作 系统 级 别 应 该 颠倒 过 来 ， 因 为 
用 户 也 通过 操作 系统 级 别 与 应 用 程序 进行 交互 。 这 样 ， 鼠 标 和 键盘 输入 实际 上 是 通过 操作 系统 
传送 给 应 用 程序 的 ， 而 不 是 直接 从 用 户 传送 给 应 用 程序 的 。 无 论 如 何 ， 你 现在 了 解 了 这 些 概念 。 

可 将 以 台式 PC 机 为 代表 的 计算 机 硬件 看 作 是 由 4 个 基本 部 件 组 成 的 : 

1. 输入 设备 : 包括 鼠标 、 键 盘 、 麦 克 风 、 磁 盘 、 调 制 解 调 器 及 网 络 等 组 件 。 

2. 输出 设备 ,包括 显示 器 、 磁 盘 、 调 制 解 调 器 、 声 卡 和 喇叭 以 及 网 络 等 组 件 。 

3. 存储 系统 : 包括 内 部 和 外 部 高 速 缓 存 (cache) 、 主 存储 器 、 视 频 存 储 器 及 磁盘 。 

4. 中 央 处 理 器 (CPU):， 包括 算术 和 多 辑 单 元 (ALU)、 控 制 系统 及 总 线 。 


总 线 


总 线 是 计算 机 的 神经 系统 ， 它 们 连接 着 计算 机 内 外 的 各 种 功能 块 。 在 计算 机 内 部 ， 一 个 
总 线 就 是 一 组 类 似 的 信号 线 ， 因 而 ， 你 的 奔腾 处 理 器 就 有 一 个 32 位 地 址 总 线 和 一 个 32 位 数据 
总 线 。 以 总 线 结构 来 看 ， 这 意味 着 有 两 束 线 ， 每 束 都 包含 着 用 于 完成 共同 功能 的 32 个 单独 信 
号 线 。 我 们 将 在 后 续 课程 中 更 深入 地 讨论 总 线 。 

一 台 典 型 的 计算 机 有 3 个 总 线 : 一 个 用 于 存储 器 地 址 ， 一 个 用 于 数据 ， 一 个 用 于 状态 ( 管 
理 和 控制 )。 产 业界 的 标准 总 线 有 PCI、ISA、AGP、PC-105、VXI， 等 等 。 由 于 为 这 些 产 业 标 
准 总 线 所 做 的 信和 号 定义 和 时 序 要 求 是 由 维护 这 些 标准 的 团体 谨慎 地 控制 的 ， 所 以 来 自 不 同 制 
造 商 的 硬件 设备 一 般 均 可 正确 地 工作 并 可 互 换 。 有 些 总 线 相当 简单 ， 只 有 一 条 线 ， 但 传 向 该 
线 的 信号 却 相 当 复 杂 ， 以 致 需要 特殊 的 硬件 和 标准 协议 来 理解 信号 。 这 种 类 型 总 线 的 例子 有 ，; 
通用 串 行 总 线 (USB)、 小 型 计算 机 系统 接口 总 线 (SCSI) 、Ethernet 以 及 Firewire 。 


存储 器 


从 软件 开发 者 的 观点 看 ， 存 储 系 统 是 计算 机 最 显而易见 的 部 件 。 如 果 没 有 存储 器 ， 我 们 
将 无 法 处 理 漂浮 不 定 的 指针 问题 。 但 是 还 有 另外 一 个 方面 : 计算 机 存储 器 是 存储 程序 代码 
(指令 ) 和 变量 (数据) 的 地 方 。 我 们 可 以 做 一 个 关于 指令 和 数据 的 简单 类 比 。 考 虑 一 个 烤 蛋 
糕 的 处 方 ， 该 处 方 本 身 是 一 组 告诉 我 们 如 何 做 蛋糕 的 指令 ， 数 据 代表 指令 要 对 其 施 以 操作 的 
配料 。 此 时 ， 如 果 没 有 面粉 可 供 往 选 ， 那 么 筛选 面粉 的 指令 就 是 没有 意义 的 。 

我 们 也 可 基于 速度 将 存储 器 描述 成 层次 化 的 。 这 里 速度 的 意思 是 当 计算 机 需要 时 ， 能 以 
多 快 的 速度 从 存储 器 中 检索 到 数据 。 最 快 的 存储 器 也 是 最 昂贵 的 ， 因 此 ， 当 存储 器 访问 时 间 
变 慢 时 ， 每 个 位 的 成 本 就 会 降低 ， 我 们 就 能 得 到 更 多 的 存储 器 。 最 快 的 存储 器 也 是 最 靠近 
CPU 的 存储 器 。 因 此 ，CPU 就 可 能 会 有 少量 的 片上 数据 寄存 器 或 存储 地 址 ， 几 千 的 片 外 cache 
存储 器 地 址 ， 几 百 万 的 主 存储 器 地 址 ， 以 及 几 十 亿 的 磁盘 存储 器 地 址 。 最 快 的 片上 存储 器 的 
访问 时 间 大 约 是 最 慢 的 硬盘 存储 器 的 访问 时 间 的 一 万 分 之 一 。 两 种 存储 器 的 成 本 比率 有 点 难 
计算 ， 因 为 最 快 的 半导体 存储 器 是 片上 cache 存 储 器 ， 而 你 不 能 在 微 处 理 器 本 身 以 外 单独 购买 
它 。 然 而 ， 如 果 我 们 要 估计 PC 机 中 每 10 亿 字 节 主 存储 器 的 成 本 与 每 10 亿 字 节 硬盘 存储 器 的 成 
本 〈 计 入 邮寄 折扣 ) 的 比率 ， 则 会 发 现在 成 本 上 ， 具 有 20~40ns 平 均 访问 时 间 的 最 快 的 半导体 
存储 器 比 具有 1ms 平 均 访问 时 间 的 硬盘 存储 器 多 300 倍 。 

今天 ， 由 于 PC 产业 的 规模 经 济 ， 存 储 器 便宜 得 难以 置信 。 一 个 具有 512MB 存 储 地 址 容量 
的 标准 存储 器 模块 (SIMM) 成 本 大 约 为 60 美 元 。 一 种 称 为 动态 随机 存储 器 (dynamic random 
access memory, DRAM) 的 存储 技术 占据 着 PC 存储 器 的 统治 地 位 。DRAM 有 若干 种 变型 ， 我 
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们 将 在 稍 后 进行 更 深入 的 讨论 。DRAM 的 特征 是 ， 它 必 须 被 经 常 地 访问 ， 否 则 将 丢失 存储 数 
据 。 这 迫使 我 们 建造 高 度 专门 化 的 复杂 的 硬件 来 支持 存储 器 系统 与 CPU 的 接口 。 这 些 器 件 包 
含 在 支持 心 片 集 (support chipset) 中 ， 对 于 现代 PC 来 讲 ， 支 持 蕊 片 集 已 经 变 得 与 CPU 同样 重 
要 了 。 为 什么 要 采用 这 些 复杂 的 存储 器 呢 ? DRAM 天 生 就 有 很 大 的 密度 ， 能 保存 多 达 512 兆 位 
的 信息 。 为 达到 这 个 密度 ， 访 问 和 控制 的 复杂 性 就 转移 到 了 芯片 集中 。 


静态 RAM (SRAM) 


我 们 将 要 关注 的 是 一 种 称 为 静态 随机 存储 器 (static random access memory, SRAM) 的 存储 
器 。SRAM 器 件 的 每 一 个 单元 都 比 DRAM 的 更 复杂 ， 但 对 该 器 件 的 总 体操 作 更 易于 理解 ， 故 我 
们 在 讨论 中 将 关注 这 类 存储 器 。 静 态 随 机 存储 器 即 SRAM 这 个 词汇 的 含义 包含 如 下 几 个 方面 : 

1. 我 们 可 以 从 芯片 中 读 取 数 据 或 者 将 数据 写 人 芯片 。 

2. 一 旦 相应 的 单元 地 址 被 提交 给 芯片 ， 芯 片 中 的 任何 存储 单元 就 皆 可 在 任何 时 间 被 访问 。 

3. 只 要 存储 器 加 上 电源 ， 我 们 就 只 需要 提供 SRAM 单 元 的 地 址 ， 再 加 上 一 个 读 或 者 写 信 
号 ， 就 能 够 访问 或 修改 单元 中 的 数据 。 这 与 DRAM 单 元 的 维护 数据 完整 性 的 要 求 有 很 大 不 同 。 
我 们 将 在 后 面 章节 中 非常 详细 地 讨论 这 一 点 。 

有 了 RAM 存 储 器 ， 就 不 需要 搜索 完 所 有 先前 的 存储 器 单元 后 才 到 达 你 要 读数 据 的 单元 了 。 
换 句 话说， 从 RAM 的 最 后 单元 读 出 数据 和 从 最 初 单元 读 出 数据 一 样 快 。 与 此 相反 ， 磁 带 备份 
设备 必须 查 完整 个 磁带 才能 检索 到 最 后 的 数据 。 这 就 是 采用 “随机 访问 ”这 个 术语 的 原因 。 
还 需要 注意 的 是 ， 当 我 们 讨论 一 般 意义 上 的 SRAM 或 DRAM 时 ， 如 第 1 项 和 第 2 项 所 列 ， 我 们 
就 只 用 术语 RAM 而 不 做 SRAM 或 DRAM 的 区 分 。 


存储 器 层次 


图 1-4 所 示 为 实际 的 存储 器 层次 ， 从 中 我 们 可 以 看 到 各 级 存储 器 元 件 是 如 何在 大 小 上 呈 指 数 
增长 的 同时 ， 在 访问 时 间 上 呈 指 数 下 降 的 。 与 CPU 最 


靠近 的 存储 器 最 小 ， 典 型 值 位 于 1KB 数 据 (1 000 个 8 位 
字符 ) 到 1MB 数 据 (1 000 000 字 符 ) 之 间 。 这 些 片 上 

cache 存 储 器 的 访问 时 间 可 小 到 1/2ns 到 1ns (1 秒 的 10 亿 oaoholL 2) 

分 之 一 )。 作 为 一 个 基准 ， 光 在 1ns 内 能 在 空气 中 传播 256KB~4MB(10ns) 


大 约 1 英 尺 。 我 们 称 该 cache 为 初级 cache， 或 L1 cache。 
在 L1 cache 之 下 就 是 二 级 cache， 或 叫 L2 cache。 

在 当今 的 奔腾 类 处 理 器 中 ，L2 cache 通 常 置 于 处 理 器 

芯片 本 身上 。 事 实 上 ， 如 果 你 揭 开 一 个 奔腾 或 Athlon 硬盘 驱动 器 

处 理 器 的 盖子 ， 并 在 显微镜 下 观看 硅 片 ， 你 就 会 惊 证 | 

地 发 现 ， 占 有 芯片 面积 百分比 最 大 的 是 cache 存 储 器 。 


二 级 cache 位 于 计算 机 的 主 存储 器 之 上 。 主 存储 器 





就 是 你 能 在 计算 机 商店 买 到 的 “存储 器 条 ”， 用 以 提 因特网 
高 计算 机 的 性 能 。 这 种 存储 器 比 片 上 cache 存 储 器 慢 很 无 限 的 (min) 


多 , 但 你 通常 可 拥有 比 片 上 存储 器 大 得 多 的 主 存储 器 。 
你 可 能 想 知 道 为 什么 加 入 更 多 存储 器 就 会 得 到 更 好 的 
性 能 ， 为 了 理解 这 一 点 ， 我 们 考虑 一 下 主 存储 器 的 下 
一 个 级 别 一 硬盘 驱 动 器 。 硬 盘 驱 动 器 有 很 大 的 容量 ， 但 这 要 以 轿 牧 速度 为 代价 。 硬 盘 是 一 


图 1-4 存储 器 层次 。 注 意 存 储 器 大 小 和 
访问 时 间 之 间 的 反比 关系 
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种 机 电 设 备 ， 数 据 存储 于 旋转 盘 上 ， 即 使 以 每 分 钟 7200 转 的 速度 旋转 ， 仍 需要 宝贵 的 时 间 使 
正确 的 数据 处 于 磁盘 读 头 之 下 。 而 且 ， 数 据 被 组 织 成 独立 的 磁道 ， 这 些 磁道 分 布 在 多 个 盘 片 
的 每 一 面 上 。 为 访问 正确 的 数据 ， 磁 盘 头 必须 在 磁道 间 移动 。 这 也 要 花费 时 间 。 

现在 ， 无 论 你 的 操作 系统 是 MAC O/S、Linux 还 是 Windows 中 的 一 种 ， 都 可 以 利用 硬盘 作 
为 一 个 便利 的 交换 场所 ， 将 特定 时 间 点 不 适合 存在 于 主 存储 器 的 程序 和 数据 交换 出 去 。 这 样 ， 
如 果 你 在 计算 机 屏幕 上 开 了 若干 个 窗口 ， 且 计算 机 只 有 64MB 的 主 存储 器 ， 那 么 你 就 会 看 到 
那个 沙漏 形状 的 光标 经 常 出 现 ， 因 为 操作 系统 正 不 断 地 将 不 同 的 应 用 交换 出 /入 主 存储 器 。 从 
图 1-4 看 到 ， 硬 盘 与 主 存储 器 访问 时 间 的 比率 能 达到 10 000 : 1， 因 此 任何 时 候 我 们 访问 硬盘 
都 要 等 待 。 这 里 的 道理 就 是 : 你 所 能 给 予 计算 机 在 性 能 上 的 最 大 提高 就 是 尽 可 能 多 地 加 入 存 
储 器 。 

最 后 ， 图 1-4 中 有 几 个 可 能 使 你 感到 陌生 的 符号 ， 我 们 将 在 适当 的 课程 中 详细 讨论 ， 但 为 
避免 你 对 其 含义 感到 疑惑 ， 这 里 先 给 出 一 点 说 明 : 


符号 名 称 含 义 

ns 纳 秒 (nanosecond) 1 秒 的 10 亿 分 之 一 

KB 千 字 节 (kilobyte) 2 或 1024 个 8 位 字符 ( 字 节 ) 
MB 兆 字 节 (megabyte) 2” 或 1 048 576 个 字 节 

GB 吉 字 节 (gigabyte) 230 或 1 073 741 824 个 字 节 
TB 太 字 节 (terabyte) 2% 或 1 099 511 627 776 个 字 节 


希望 这 些 数 字 很 快 就 能 被 你 所 熟知 ， 因 为 它们 是 现代 计算 机 技术 的 衡量 尺度 。 但 有 一 点 
要 注意 ，kilo ( 千 )、mega ( 净 )、giga ( 吉 ) 以 及 tera ( 太 ) 这 些 术 语 经 常 承载 了 多 种 含义 ， 
有 时 ， 它 们 会 被 用 于 严格 的 科学 意义 ， 分 别 代表 乘法 因子 10"、105、10" 以 及 102 的 速记 方式 。 
那么 ， 你 如 何 才能 知道 正在 使 用 的 是 计算 机 语言 方式 (2"、22”、2”、24) ， 还 是 传统 科学 和 
工程 的 意义 呢 ? 这 是 个 好 问题 。 有 时 ， 区 分 不 是 那么 明显 ， 就 可 能 搞 错 。 例 如 ， 每 当 涉及 存 
储 器 大 小 和 相关 问题 时 ， 我 们 几乎 总 是 采用 以 2 为 基数 的 意思 。 可 是 ， 也 不 总 是 这 样 。 硬 盘 驱 
动 器 虽然 是 存储 设备 ， 却 采用 这 些 术语 的 工程 意义 。 因 此 ， 一 个 老式 的 1GB 硬 盘 驱 动 器 与 
1GB 存 储 器 所 拥有 的 数据 并 不 是 等 量 的 ， 因 为 术语 “giga” 采 用 了 两 种 不 同 的 意义 。 总 之 ， 本 
书 中 的 术语 一 般 是 取 以 2 为 基数 的 意思 ， 除 非 另外 说 明 。 在 实际 中 ， 读 者 应 自己 小 心 。 


硬盘 驱动 器 


让 我 们 再 稍微 深入 观察 一 下 硬盘 驱动 器 的 动力 学 问题 。 磁 盘 驱 动 器 是 工程 技术 的 奇迹 。 
多 年 以 来 ， 电 子 工业 分 析 家 都 在 预测 硬盘 驱动 器 的 让 位 问题 。 在 成 本 上 与 硬盘 驱动 器 一 样 很 
有 效 的 经 济 型 的 半导体 存储 器 总 是 “一 些 年 之 后 的 事情 *。 然 而 ， 磁 盘 驱 动 器 制造 商 无 视 这 些 
权威 评论 ， 而 是 继续 提高 磁盘 驱动 器 的 容量 和 性 能 ， 增 强 可 靠 性 ， 降 低 成 本 。 目 前 ， 一 般 的 
磁盘 驱动 器 1GB 存 储 容量 的 成 本 大 约 是 60 美 分 。 

考虑 一 下 现代 的 高 性 能 磁盘 驱动 器 。 特 别 地 ， 让 我 们 考察 一 下 来 自 Seagate Technology4 的 
ST3146807LC 型 磁盘 驱动 器 。 以 下 是 该 驱动 器 的 相关 规范 ， 

。 旋转 速度 : 10 000 rpm 

。 接 口 ，Ultra320 SCSI 

。 盘 片 数 /磁头 数 ，4/8 

。 格式 化 容量 (512 字 节 / 遍 区 ) 146.8 : GB 
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。 柱 面 数 : 49 855 

。 每 个 驱动 器 扁 区 数 : 286 749 488 

。 外 部 传输 速率 : 320MB/s 

。 道 间 寻 找 时 间 读 / 写 (ms) : 0.35/0.55 

。 平均 寻找 时 间 读 / 写 (ms) : 4.7/5.3 

。 平均 潜伏 期 (ms) : 2.99 

这 些 都 是 什么 意思 呢 ? 图 1-5 给 出 了 上 述 Seagate Cheetah 硬 盘 驱 动 器 的 一 个 十 分 简化 的 示 
意图 。 该 硬盘 由 4 个 铝 盘 组 成 ， 铝 盘 的 每 一 面 都 有 磁性 材料 涂 层 用 于 记录 存储 的 数据 。 在 每 个 
盘 的 上 方 有 一 个 微小 的 检 拾 器 ， 或 者 叫 磁 头 (head) ， 通 过 气垫 浮动 于 磁盘 上 。 从 真实 的 意义 
上 说 ， 磁 头 是 以 远 小 于 人 的 毛发 粗细 的 距离 在 盘 的 表面 上 飞行 ， 因 此 ， 当 磁盘 崩溃 时 ， 其 结 
果 就 与 飞机 坠毁 时 类 似 。 无 论 是 哪 种 情况 ， 飞 机 或 读 / 写 头 都 是 失去 提升 力 ， 磁 撞 到 地 面 或 磁 
盘 表 面 上 。 当 这 种 情况 发 生 时 ， 磁 性 材料 会 被 毁坏 ， 磁 盘 将 无 法 使 用 。 


磁道 49854 10,000 RPM 


A 磁道 0 


磁头 0 
Wp 








磁头 7 2 


0.35/0.55 道 间 寻 找 时 间 
图 1-5 Seagate Cheetah 硬 盘 驱 动 器 的 示意 图 


每 个 表面 包含 49 855 个 同心 磁道 ， 每 个 磁道 都 是 分 离 的 ， 不 与 相 邻 磁道 连接 ， 就 像 一 个 
螺旋 。 这 样 ， 为 了 从 一 个 磁道 移动 到 另 一 个 相 邻 的 磁道 ， 磁 头 必 须 稍微 移动 一 点 距离 。 所 有 
磁头 都 连接 到 一 个 共同 的 轴 ， 该 轴 能 迅速 精确 地 将 磁头 转动 到 新 位 置 。 由 于 所 有 表面 的 磁道 
是 垂直 排列 的 ， 所 以 我 们 称 其 为 柱 面 (cylinder) 。 因 此 ，4 个 盘 的 柱 面 0 包含 8 个 磁道 。 

现在 ， 我 们 如 何 得 到 一 个 146.8GB 的 驱动 器 呢 ? 首先 ， 每 个 盘 包 含 两 个 表面 ， 而 我 们 有 4 
个 盘 ， 所 以 驱动 器 的 总 容量 就 是 一 个 表面 容量 的 8 倍 。 每 个 扇 区 可 容纳 512 字 节 数 据 ， 将 总 遍 
区 数 除 以 8， 我 们 看 到 每 个 表面 有 35 843 686 个 扁 区 。 将 该 数 再 除 以 49 855， 我 们 看 到 每 个 磁 
道 大 约 有 719 个 扇 区 。 有 趣 的 是 实际 数字 是 每 个 磁道 718.96 个 扇 区 ， 那 么 ， 为 什么 不 采用 这 个 
值 呢 ? 换 名 话说， 我们 怎样 才能 使 用 一 个 分 数值 的 每 磁道 扁 区 数 呢 ? 

有 很 多 可 能 性 ， 我 们 无 需 详 述 。 无 论 如 何 ， 一 种 可 能 性 是 磁盘 表面 上 每 个 磁道 的 扇 区 数 
不 均匀 ， 因 为 当 从 磁盘 中 心 向 外 移动 时 ， 扇 区 间隔 会 发 生变 化 。 在 CD-ROM 或 DVD 驱动 器 中 ， 
这 种 不 均匀 可 以 通过 在 激光 移 进 和 移出 时 改变 驱动 器 的 旋转 速度 来 矫正 。 但 是 ， 由 于 硬盘 以 
固定 速率 旋转 ， 所 以 当 我 们 从 内 磁道 向 外 磁道 移动 时 ， 改 变 记录 密度 最 为 合理 。 

让 我 们 回 过 头 来 继续 计算 。 如 果 每 个 磁道 容纳 719 个 扁 区 ， 每 个 扁 区 512 个 字 节 ， 则 
每 个 磁道 能 容纳 368 128 字 节 的 数据 。 由 于 每 个 柱 面 有 8 个 磁道 ， 所 以 每 个 柱 面 就 能 容纳 
2 945 024 字 节 。 至 此 ， 就 得 到 了 这 个 大 数字 。 由 于 有 49 855 个 柱 面 ， 我 们 得 到 的 总 容量 
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就 是 146 824 171 520 字 节 ， 即 146.8GB。 

在 我 们 离开 磁盘 驱动 器 这 个 主题 之 前 ， 让 我 们 再 考虑 一 个 问题 。 考 察 上 述 的 硬盘 驱动 器 
的 规范 ， 我 们 会 发 现 访问 时 间 是 以 毫秒 (ms) 即 和 分 之 一 秒 作为 度量 单位 的 。 这 样 ， 如 果 你 
的 数据 扇 区 广 布 于 磁盘 各 处 ， 那 么 访问 512 字 节 的 每 个 块 就 很 容易 用 到 几 秒 种 的 时 间 。 将 这 个 
时 间 与 访问 存储 于 主 存储 器 中 的 数据 所 需 的 时 间 进 行 比较 ， 就 很 容易 发 现 为 什么 硬盘 驱动 器 
比 主 存储 器 慢 10 000 倍 了 。 


复杂 指令 集 计算 机 (CISC) 体系 结构 和 精简 指令 集 计算 机 (RISC) 体系 结构 


目前 ， 有 两 种 占 统治 地 位 的 计算 机 体系 结构 : 复杂 指令 集 计 算 机 (CISC) 体系 结构 和 精 
简 指令 集 计 算 机 (RISC) 体系 结构 。CISC 的 代表 就 是 通常 所 说 的 冯 . 诺 依 曼 体 系 结构 ， 由 普 
林 斯 顿 大 学 的 约翰 . 加“ 诺 依 曼 所 发 明 。 在 冯 : 诺 依 曼 体系 结构 中 ， 指 令 存储 器 和 数据 存储 
器 共享 同一 个 物理 存储 空间 ， 这 可 能 会 导致 产生 一 种 称 为 冯 ，. 诺 依 曼 浇 开 (von Neumann 
bottleneck) 的 情况 ， 即 外 部 地 址 和 数据 总 线 是 同一 个 ， 必 须 提供 双重 服务 : 为 执行 程序 而 从 
存储 器 向 处 理 器 传送 指令 ， 为 存储 和 检索 程序 变量 而 从 /向 存储 器 移动 数据 。 

当 处 理 器 在 移动 数据 时 ， 将 无 法 获取 下 一 条 指令 ， 反 之 亦 然 。 对 这 种 困境 的 一 种 解决 方 
法 就 是 ， 引 入 分 离 的 片上 指令 和 数据 cache， 我 们 在 后 面 将 会 看 到 。Motorola 的 68000 处 理 器 及 
其 后 继 和 Intel 的 8086 处 理 器 及 其 后 继 都 是 典型 的 CISC 处 理 器 。 在 后 面 学 习 到 流水 线 时 ， 我 们 
将 更 深入 地 考察 CISC 处 理 器 和 RISC 处 理 器 的 区 别 。 

注释 : 你 经 常会 看 到 处 理 器 被 表示 为 80x86 或 680x0， 其 实 ， 这 里 的 “x” 是 占 位 

符 、 它 表示 一 个 系列 的 器 件 。 因 此 ，80x86 (通常 写 为 x86) 代表 : 8086、80186、 

80286、80386、80486 和 80586 (第 一 个 奔腾 处 理 器 ) 。Motorola 的 处 理 器 就 是 : 

68000、68010、68020、68030、68040 和 68060。 


哈佛 大 学 的 Howard Aiken 设 计 了 另 一 种 计算 机 体系 结构 ， 我 们 现在 通常 将 它 归 于 精简 指 
令 集 计算 机 (RISC) 体系 结构 。 经 典 的 哈佛 体系 结构 计算 机 有 两 个 完全 分 开 的 存储 空间 ， 一 
个 用 于 指令 ， 一 个 用 于 数据 。 一 个 具有 这 两 种 存储 器 的 处 理 器 能 够 更 高 效 地 工作 ， 因 为 数据 
和 指令 只 有 在 需要 时 才 从 计算 机 的 存储 器 中 取出 来 ， 而 不 是 在 总 线 可 用 时 就 取出 来 。 第 一 个 
流行 的 采用 哈佛 体系 结构 的 微 处 理 器 是 AMD 的 Am29000。 该 器 件 在 早期 的 HP 激光 打印 机 中 相 
当 流 行 ， 但 后 来 失宠 了 ， 基 原因 是 设计 有 两 个 分 离 存 储 器 的 计算 机 在 成 本 上 并 非 很 有 效 。 双 
存储 空间 在 性 能 上 带 来 的 明显 好 处 是 鼓舞 CPU 设 计 者 以 指令 和 数据 cache 的 形式 将 存储 空间 移 
到 芯片 上 ， 这 在 现今 的 高 性 能 微 处 理 器 中 是 常见 的 。 

如 果 我 们 考察 过 去 几 年 来 工作 站 性 能 的 提高 ， 就 会 看 到 CPU 能 力 的 增强 是 相当 明显 的 。 
有 趣 的 是 ， 仅 仅 过 了 4 年 ， 一 台 像 Intel 2.4GHz 奔 腾 4 这 样 的 高 端 PC 就 轻易 地 超过 了 一 台 DEC 
Alpha 21254/600 工 作 站 的 性 能 。 

图 1-6" 是 工作 站 性 能 随时 间 的 变化 图 。 

这 些 计 算 机 的 相对 性 能 是 用 一 组 称 为 测试 基准 (benchmark) 的 标准 程序 来 度量 的 。 在 该 
例 中 用 的 是 产业 界 标准 的 SPECbase_int92 测 试 基准 。 用 基于 这 些 数 字 的 性 能 来 与 更 现代 的 性 
能 度量 进行 结果 比较 是 困难 的 ， 因 为 测试 基准 一 直 在 变化 。 目 前 , 首选 的 测试 基准 是 SPECint95， 
它 与 早期 的 SPECint92 测 试 基准 没有 直接 关系 s5。 然 而 ， 根 据 Mann 的 估计 ， 用 一 个 大 约 为 38 的 变 
换 因 子 就 能 达到 进行 粗略 比较 的 目的 。 因 此 ， 根 据 已 发 表 的 结果 7， 一 个 1.0G Hz 的 AMD 
Athlon 处 理 器 用 SPECint95 测 试 基准 得 到 的 结果 是 42.9， 大 致 相当 于 用 SPECint92 得 到 1630 的 
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结果 。DEC 公 司 的 AlphaStation 5/300 是 一 款 对 两 组 测试 基准 都 公布 了 结果 的 工作 站 ， 其 度量 
值 在 图 1-6 中 大 概 是 280， 而 根据 SPECint95 测 试 基准 则 是 7.33， 将 该 数 乘 以 38 ， 我 们 就 得 到 
278.5， 与 早期 的 值 保持 了 合理 的 一 致 性 。 在 后 续 章 节 中 ， 我 们 还 将 谈 到 性 能 度量 问题 。 


1200 r---------------------------------- 一 一- 
DEC Alpha 21254/600 


下 麻 
8 
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年 代 
图 1-6 工作 站 性 能 随时 间 的 改进 (由 Patterson 和 Hennessy 提 供 ) 


1.3 数 制 


在 计算 机 中 如 何 表示 一 个 数 呢 ? 如 何在 处 理 器 和 存储 器 之 间或 在 微 处 理 器 内 部 传送 该 数 ， 
无 论 这 个 数 是 字符 (char) 、 整 数 (int)、 浮 点 数 (float) 还 是 双 精 度 浮 点 数 (double) ? 这 是 
一 个 合情合理 的 问题 ， 其 答案 可 以 使 我 们 明白 
为 什么 现代 数字 计算 机 是 基于 二 进 制 的 (以 2 
为 基数 )。 为 了 探讨 这 个 问题 ， 先 考虑 图 1-7。 

在 图 1-7 中 ， 我 们 做 一 个 简单 的 实验 。 假 
设 我 们 能 将 一 个 电压 置 于 线 上 ， 用 来 代表 我 
们 要 在 计算 机 的 两 个 功能 元 件 间 传输 的 数字 。 

这 种 方法 对 于 传输 简单 数字 是 可 行 的 ， 但 若 

想 发 送 2000.456， 我 就 不 想 用 线 来 传输 了 ! 实 

际 上 ， 这 种 方法 既 相当 慢 又 昂贵 ， 并 且 仅 适 
合 于 窄 范 围 值 的 传输 。 

然而 ， 这 不 意味 着 这 种 方法 就 根本 不 能 
用 。 事 实 上 ， 电 子 计算 机 的 最 早 家 族 之 一 就 
是 模拟 计算 机 (analog computer) ， 模 拟 计算 下 
机 是 基于 线性 放大 器 (linear amplifier) 的 ， 图 1-7 用 线 上 电压 表示 数字 什 
就 是 某 种 你 也 许 能 在 家 里 见 到 的 立体 声 收 音 机 中 的 电子 电路 。 关 键 的 一 点 是 : 在 由 电路 特性 
所 限定 的 范围 内 ， 变 量 (这 里 就 指 线 上 电压 ) 可 呈现 为 无 穷 个 值 。 在 很 多 早期 的 模拟 计算 机 


24.56345 V 
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中 ， 这 个 范围 可 能 在 -25V~+25V 之 间 。 这 样 ， 此 范围 内 可 表示 为 稳定 或 时 变 电 压 的 任何 量 均 
可 作为 模拟 计算 机 的 一 个 变量 。 

模拟 计算 机 所 利用 的 事实 是 ， 存 在 能 进行 如 下 数学 运算 的 电子 电路 : 

。 加 / 减 

。 对 数 / 反 对 数 

。 乘 / 除 

。 微分 /积分 

通过 将 这 些 电路 接连 地 结合 ， 并 且 在 中 间 采 用 放大 和 换算 等 电路 ， 就 能 很 容易 地 建立 起 
实时 系统 模型 ， 当 系统 运行 时 ， 就 能 求 得 复杂 的 线性 微分 方程 的 解 。 

但 是 ， 模 拟 计算 机 与 立体 声 系统 一 样 具 有 局 限 性 ， 即 其 放大 精确 性 不 能 达到 无 限 完美 ， 
因此 ， 可 希望 的 最 好 精确 度 为 0.01% ， 或 者 说 是 万 分 之 一 。 图 1-8 给 出 了 一 个 模拟 计算 机 ， 这 
是 二 战 期 间 美 国 潜艇 所 使 用 的 型 号 。 鱼 雷 数据 计算 机 (Torpedo Data Computer, TDC) 取 罗 盘 
指向 、 目 标 船 速度 、 潜 艇 方向 和 速度 、 期 望 的 射击 距离 作为 输入 ， 然 后 ， 将 算出 的 正确 速度 
和 方向 传送 给 鱼雷 ， 鱼 雷 就 会 遵循 TDC 传 输 给 它们 的 路 线 、 速 度 和 深度 前 进 。 

于 是 ， 在 20 世 纪 40 年 代 电 子 电 路 的 局 限 下 ， 整 个 计算 机 体系 采用 的 是 基于 连续 变量 的 输入 
和 输出 。 在 这 种 意义 上 来 讲 ， 立 体 声 放大 器 就 是 一 个 模拟 计算 机 。 放 大 器 的 功能 是 放大 或 者 提 
高 电信 号 。 一 个 增益 (gain) 为 10 的 放大 器 任意 时 刻 的 输出 电压 都 是 输入 电压 的 10 倍 ， 所 以 ， 
Vou = 10Vis。 这 样 ， 我 们 就 有 了 一 个 模拟 计算 模块 ， 它 恰好 是 一 个 有 常数 乘 数 的 乘法 模块 。 

让 我 们 还 是 返回 到 对 数 制 的 讨论 。 我 们 也 许可 以 改进 这 个 方法 ， 途 径 是 将 数字 分 割 为 更 
易 处 理 的 几 个 部 分 ， 并 且 在 同一 时 间 内 ， 在 若干 条 线 上 (并 行 ) 发 送 范 围 更 有 限 的 信号 。 这 
样 ， 每 条 线 就 仅 需 要 传输 一 个 窄 范 围 的 值 。 图 1-9 给 出 了 工作 原理 。 


鱼雷 数据 计算 机 攻 


PONNAND 





图 1-8 二 战 期 间 潜 艇 上 的 模拟 计算 机 。 照 片 图 1-9 在 计算 机 中 采用 并 行 线束 传输 数字 值 。 线 在 
来 自 www fleetsubmarine.com 线束 中 的 位 置 决 定 了 其 数字 权重 。 每 条 线 携 
带 的 电压 值 在 0V~9V 之 间 
在 本 例 中 ， 该 束 线 中 的 每 一 条 线 代 表 一 个 十 进 制 数位 ， 我 们 发 送 的 每 个 数字 都 将 用 这 些 
线 上 的 相应 电压 来 表示 。 这 样 ， 就 不 需要 传输 12 567V 这 种 可 能 致命 的 电压 ， 每 条 线 上 的 电压 


都 不 会 大 于 9V 电 池 提 供 的 电压 。 让 我 们 在 这 里 停留 一 下 ， 因 为 这 种 途径 看 起 来 有 前 途 。 线 上 


的 电压 要 达到 怎样 的 精确 度 才 能 使 电路 将 数字 解释 为 4， 而 不 是 3 或 5 呢 ? 在 图 1-9 中 ， 电 压 表 
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显示 ， 从 下 向 上 数 的 第 二 条 线 的 测量 值 为 4.2V， 不 是 4V。 这 样 的 结果 足够 好 了 吗 ? 该 值 实际 
上 应 该 达到 4.000 土 0.0005V 这 样 的 精度 吗 ? 在 所 有 的 可 能 性 中 ， 系 统 在 每 个 电压 增加 时 有 大 
约 0.3V 偏 差 的 情况 下 可 能 会 运行 良好 ， 因 此 ， 为 保证 电路 接收 到 正确 的 数字 ， 我 们 只 需要 发 
送 4 土 0.3V (3.7~4.3V)。 如 果 电 路 出 错 而 发 送 了 4.5V， 会 怎么 样 呢 ?把 这 个 电压 看 作 是 4 的 话 
太 小 ， 看 作 是 5 的 话 又 太 大 ， 结 果 就 是 我 们 不 知道 将 会 发 生 什么 事情 ， 因 为 由 4.5V 所 代表 的 值 
是 未 定义 的 。 我 们 希望 计算 机 能 正确 地 工作 而 没有 此 类 问题 。 

图 1-9 提 出 的 方法 实际 上 非常 接近 现实 ， 但 仍 不 完全 是 我 们 所 需要 的 。 在 现代 计算 机 的 速 
度 下 ,设计 既 足 够 快 又 能 足够 精确 地 在 线 上 进行 10 个 不 同 电压 值 之 间 的 转换 的 电路 仍然 是 极 
其 困难 的 。 然 而 ， 这 个 思想 将 在 下 一 代 计算 机 存储 单元 中 得 到 考虑 。 后 面 还 有 更 多 关于 这 方 
面 的 内 容 ， 留 心 哦 ! 

现代 的 晶体 管 是 极 好 的 开关 ， 它 们 能 在 几 兆 分 之 一 秒 ( 儿 微 微 秒 ) 内 对 电压 或 电流 进行 开关 
变换 。 能 利用 这 一 点 吗 ? 让 我 们 想 一 想 。 假 设 扩展 线束 的 概念 ,进一步 对 单个 线 上 的 值 进 行 限制 。 
那么 ， 由 于 每 条 线 被 一 个 开关 控制 ， 我 们 将 可 以 在 无 电压 (0V) 和 某 个 电压 ( 约 3V) 之 间 进 行 
开关 。 这 意味 着 每 条 线 只 可 携带 两 个 数字 ，0 或 某 个 值 〈 非 0)。 这 能 行 吗 ? 让 我 们 看 一 下 图 1-10。 


浊 于 下 下 沁 烛 浊 洲 半 沁 尘 浊 汪汪 冰 册 
1 


图 1-10 以 二 进 制 值 发 送 数字 。 每 个 箭头 线 代 表 一 条 线 ， 稍 头 表示 信号 传输 的 方向 。 
每 条 线 在 线束 中 的 位 置 代表 数字 的 权重 。 各 行 代表 2 的 不 断 上 升 的 等 


在 这 个 方案 中 ， 因 为 单个 线 所 携带 的 信息 数量 被 限制 为 0 或 者 某 个 值 (我 们 将 某 个 值 称 为 
“1” 或 者 “ 开 ”)， 所 以 我 们 就 需要 很 多 线 来 传输 重要 的 东西 。 图 1-10 显 示 的 是 16 条 线 ， 你 很 
快 就 会 发 现 ， 如果 处 理 的 是 无 符号 数 ， 那 么 该 数 就 会 被 限制 在 0~65 535 之 间 ， 如 果 是 有 符号 
数 ， 那 么 限制 范围 就 在 -32 768~32 767 之 间 。 这 里 ， 十进制 数 0 用 二 进 制 数 表示 为 
0000000000000000， 而 十 进 制 数 65 535 用 二 进 制 数 表 示 为 1111111111111111。 

注释 : 多 年 以 来 ， 大 多 数 标准 数字 电路 都 是 采用 5V 来 代表 1 的 。 然 而 ， 随 着 集成 
电路 变 得 更 小 更 紧密 ， 还 辑 电 平 也 必须 降低 。 目前， 现代 大 腾 或 Athlon 处 理 器 的 电压 

约 为 1.7~1.8V， 与 标准 AA 电 池 的 差别 不 是 很 大 。 

现在 ， 我 们 终于 将 原理 弄 明白 了 ， 我 们 将 利用 电子 开关 元 件 或 晶体 管 能 在 线 上 的 两 个 电 
压 值 之 间 进 行 快速 转换 这 个 事实 。 最 常见 的 开关 形式 是 在 近乎 0V 和 某 电压 值 (大约 3V) 之 间 。 
如 果 系 统 工作 正常 ， 则 我 们 定义 的 “ 零 ” 或 0 应 从 不 超过 1V 的 大 约 1/2。 这 样 ， 我 们 就 可 定义 
数字 0 为 任何 小 于 1/2V (实际 上 ， 通 常 是 0.4V) 的 电压 。 类 似 地 ， 我 们 定义 成 1 的 数字 应 从 不 
小 于 2.5V。 由 此 ， 我 们 就 有 了 定义 数 制 所 需 的 所 有 信息 。 这 里 ， 数 字 0 从 不 大 于 0.4V， 数 字 1 
从 不 小 于 2.5V。 任 何在 这 两 个 范围 之 间 的 数 都 被 看 成 是 未 定义 的 和 不 允许 的 。 

应 该 提 到 的 是 我 们 总 是 在 谈 及 “ 线 上 电压 ”"”， 那 么 在 计算 机 中 ， 线 究竟 在 哪里 呢 ? 严格 地 
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种 了 章 





说 ， 我 们 应 该 称 这 些 线 为 “电导 体 ”。 它 们 可 以 是 实际 的 线 ， 比 如 用 来 将 打印 机 连接 到 计算 机 
后 面 并 行 端口 的 电缆 之 中 的 线 ， 它 们 也 可 以 是 计算 机 内 部 印刷 电路 板 中 的 那些 细 的 导电 路 
径 ， 最 后 ， 它 们 也 可 以 是 处 理 器 芯片 内 部 的 那些 微小 的 铝 导体 。 图 1-11 给 出 了 一 部 分 印刷 电 


路 板 ， 该 印刷 电路 板 取 自作 者 设计 的 计算 机 。 


请 注意 ， 该 集成 电路 (IC) 的 一 些 
引 脚 显示 出 有 线 将 其 与 另外 的 器 件 相 
连 ， 而 另 一 些 引 脚 则 看 起 来 并 未 与 其 他 
器 件 相连 。 其 原因 是 印刷 电路 板 实际 上 
是 由 5 个 薄 层 组 成 的 三 明治 ， 层 的 每 一 
面 都 有 印刷 线 ， 总 共有 10 层 ，8 个 内 层 
之 间 还 有 薄 的 绝缘 层 以 防止 电 短路 。 在 
制造 过 程 中 ，5 个 导电 层 和 4 个 绝缘 层 是 
小 心地 排列 和 结合 在 一 起 的 ， 所 形成 的 
10 层 印刷 电路 板 接近 2.5mm 厚 。 

没有 这 种 多 层 制 造 技术 ， 就 不 可 能 
建造 复杂 的 计算 机 系统 ， 其 原因 是 : 要 
在 两 个 组 件 间 连 线 ， 而 又 不 穿 过 具有 不 
同 用 途 的 另 一 条 线 ， 这 是 不 可 能 的 。 





图 1-11 计算 机 电路 板 上 的 印刷 线 。 实 际 上 每 条 线 都 是 


铜 轨迹 线 ， 大 约 0.08mm 宽 。 轨 迹 线 之 间 的 间距 
为 0.08mm。 大 的 圆 点 是 被 焊接 的 引 脚 ， 来 自 电 
路 板 的 另 一 面 


图 1-12 [注释 : 该 图 的 彩色 版 本 包含 在 随 书 DVD 光 盘 中 。] 只 给 出 了 内 层 的 情况 ， 这 是 
另 一 个 计算 机 系统 硬件 电路 的 X 射 线 视图 ， 这 同 你 在 PC 机 的 母 板 上 所 看 到 的 电路 有 大 致 相同 


级 别 的 复杂 度 。 这 个 视图 透 过 电路 板 的 各 层 ， 


由 于 这 看 起 来 相当 复杂 ， 所 以 大 多 数 
版 图 都 是 由 计算 机 辅助 设计 (CAD) 软件 
来 制作 的 。 要 完成 这 个 电路 板 的 布线 ， 即 
使 是 一 个 熟练 的 设计 者 也 需要 相当 多 的 时 
间 。 图 1-13 是 图 1-12 的 一 小 部 分 版 图 的 放大 ， 
在 这 里 你 可 以 清楚 地 看 到 不 同 层 次 上 的 各 
种 轨迹 线 。 每 条 印刷 线 大 约 有 0.03mm 宽 。 

如 果 你 仔细 观察 图 1-13[ 注 释 : 该 图 的 
彩色 版 本 包含 在 随 书 DVD 光 盘 中 。]， 就 会 
发 现 某 些 彩色 线 接触 到 了 一 个 黑 点 ， 然 后 
似乎 是 作为 一 条 不 同 颜色 的 线 转向 了 另 一 
个 方向 。 这 些 黑 点 被 称 为 通 孔 (via) ， 表 
示 在 电路 中 一 条 线 离开 它 所 在 的 层 而 穿 到 
另 一 层 的 位 置 。 通 孔 是 垂直 导体 ， 它 能 使 
信号 在 层 间 穿行 。 如 果 没 有 多 个 层 以 及 层 
间 的 通 孔 ， 印 刷 电 路 板 上 的 线 就 不 能 彼此 
穿 过 而 又 不 短路 。 因 此 ， 当 你 看 到 一 条 绿 
线 (对 图 1-13 的 灰 度 图 像 ， 绿 线 呈 现 为 点 
线 ) 穿 过 一 条 红线 时 ， 要 知道 这 两 条 线 不 
是 在 物理 上 有 接触 ， 而 是 在 板 的 不 同 层 中 





图 1-12 某 计算 机 系统 的 一 部 分 电路 板 的 X 射 线 视图 


每 层 的 导电 轨迹 线 都 是 以 不 同 颜色 显示 的 。 
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穿 过 。 这 是 一 个 需要 牢记 的 重要 概念 ， 因 为 我 们 很 快 就 要 看 到 并 绘制 我 们 自己 的 电子 电路 图 ， 
称 为 示意 图 (schematic diagram) ， 而 且 我 们 需要 牢记 如 何 表示 那些 看 起 来 互相 交叉 但 在 物理 
上 无 连接 的 线 ， 以 及 那些 真正 互相 连接 的 线 。 

让 我 们 回顾 一 下 刚才 讨论 的 内 容 。 现 二 
代数 字 计算 机 采用 的 是 二 进 制 ( 基 为 2) ”中 输 
数 制 ， 采 用 这 种 数 制 的 原因 是 : 这 种 在 其 
数字 的 自然 序列 中 只 有 两 个 数字 的 数 制 有 
助 于 硬件 系统 利用 开关 来 指示 电路 是 处 于 
“1” 状 态 (on) 还 是 处 于 “0” 状 态 (off)。 
而 且 ， 用 于 建造 复杂 数字 网 络 的 基本 电路 
元 件 作为 逻辑 表达 式 也 是 基于 这 些 原理 。 
所 以 ， 就 像 我 们 可 能 说 ， 在 逻辑 上 一 个 表 
达 式 为 TRUE 或 FALSE， 我 们 可 以 简单 地 
用 “1”(TRUE) 或 “0”(FALSE) 来 描 
述 。 你 很 快 就 会 看 到 ， 将 1 与 TRUE、0 与 
FALSE 关 联 完 全 是 任意 的 ， 我 们 可 以 颠倒 
这 种 指定 而 很 少 或 没有 负面 影响 。 但 是 ， 图 1-13 图 1-12 所 示 电 路 板 的 部 分 放大 视图 
现在 我 们 还 是 采用 习惯 表示 ， 即 二 进 制 数 1 代表 TRUE 或 ON 条 件 ， 二 进 制 数 0 代表 FALSE 或 
OFF 条 件 。 我 们 将 这 些 总 结 在 下 表 中 





二 进 制 值 电路 值 逻辑 值 
0 OFF FALSE 
1 ON TRUE 
一 个 简单 的 二 进 制 实例 


由 于 你 可 能 从 来 没有 接触 过 电路 图 ， 所 以 我 们 现在 开始 学 习 。 图 1-14 是 一 个 电路 的 简单 示 
意图 ， 其 中 包含 一 个 电池 、 标 记 为 A 和 B 的 两 个 开关 和 一 个 灯泡 C。 电 池 的 正极 端 标记 为 加 (+) 
号 ， 负 极端 标记 为 减 (一 ) 号 。 想 像 一 下 你 可 能 在 便携 式 MP3 播 放 器 中 使 用 的 典型 AA 电 池 ， 有 
小 凸 起 的 一 端 是 正极 端 ， 而 有 平面 部 分 的 另 一 端 是 负极 端 。 参 见 图 1-14， 正 极端 用 宽 线 画 出 ， 
负极 端 用 窗 线 画 出 ， 这 看 起 来 可 能 有 些 古 怪 。 之 所 以 这 么 画 ， 是 有 原因 的 ， 但 我 们 在 这 里 就 不 
对 此 进行 讨论 了 。 学 电子 工程 的 学 生 在 开始 时 就 被 告知 了 这 个 原因 ， 但 我 宣誓 保守 秘密 。 





图 1-14 采用 两 个 串 行 开 关 表 示 与 (AND) 函数 的 简单 电路 


当 有 足够 电流 流 过 灯泡 C 使 灯丝 加 热 时 ， 灯 钨 将 变 亮 。 我 们 假设 在 此 电路 中 ， 电 流 从 正极 
流向 负极 。 这 样 ， 电 流 在 + 端 离开 电池 ， 经 过 闭合 的 开关 (A 和 B)， 再 经 过 灯 ， 最 终 到 达 电 池 
的 - 端 。 你 可 能 会 觉得 奇怪 ， 因 为 我 们 从 高 中 的 科学 课堂 上 得 知 ， 电 流 实际 上 是 由 带 负电 的 电 
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子 组 成 的 ， 是 从 电视 的 负极 端 流向 正极 端 ， 而 这 个 的 方向 却 相 反 。 

对 这 个 显然 自 相 矛盾 的 说 法 的 答案 是 : 历史 惯例 。 只 要 我 们 认为 电流 是 带 正 电 的 ， 一切 
问题 就 都 解决 了 。 

无 论 如 何 ， 为 了 使 电流 流 经 灯丝 ， 必 须发 生 两 件 事 :开关 A 必须 闭合 (ON)， 并 且 开 关 B 
必须 闭合 (ON)。 当 这 个 条 件 满足 时 ， 输 出 变量 C 将 为 ON ( 变 亮 )。 这 样 ， 我 们 就 可 以 讨论 第 
一 个 逻辑 等 式 的 例子 了 : 

C=A ANDB 


这 是 一 个 非常 有 趣 的 结果 ， 我 们 已 经 看 到 采用 开关 来 建造 计算 机 系统 的 两 个 显然 非常 不 
同 的 结果 。 第 一 个 结果 是 我 们 必须 处 理 二 进 制 数 ( 基 为 2)， 第 二 个 结果 是 开关 也 允许 我 们 建 
立 逻 辑 等 式 。 现 在 ,保留 第 二 项 作为 有 趣 的 结果 ， 我 们 将 在 下 一 章 对 其 做 更 深入 的 讨论 。 在 
离开 图 1-14 之 前 ， 我 们 应 该 指出 ， 开 关 A 和 B 实 际 上 是 机 械 致 动 的 。 某 个 人 轻 拨 开关 即 可 打开 
或 关闭 它 。 一 般 情 况 下 ， 开 关 是 三 端 装置 (three-terminal device)， 有 一 个 控制 输入 ， 用 于 确 
定 其 他 两 端 之 间 的 信号 传播 。 


基数 


让 我 们 回 到 对 二 进 制 数 制 的 讨论 。 我 们 习惯 使 用 十 进 制 〈 基 为 10) 数 制 ， 因 为 在 有 iMAC 
(苹果 电脑 ) 之 前 ， 我 们 有 10 个 手指 。 一 个 数 制 的 基数 (base) 或 根 (radix) 就 是 指 该 数 制 中 
不 同 数字 的 个 数 。 请 看 下 表 : 


基数 2 0,1 二 进 制 
基数 8 0, 1,2, 3, 4, 5, 6,7 八进制 
基数 10 0, 1,2, 3, 4, 5, 6, 7, 8,9 十 进 制 
基数 16 0, 1,2, 3,4, 5, 6, 7, 8,9, A, B,C, D, E,F 十 六 进 制 


看 一 下 上 表 的 十 六 进 制 数 ， 有 16 个 不 同 的 数字 (0~9，A~F)， 表 示 十 进 制 数 的 0~15， 但 


这 里 是 在 十 六 进 制 数 制 中 表示 它们 。 

如 果 你 曾经 遭遇 过 计算 机 “蓝屏 死机 ”而 锁 住 ， 你 也 许 能 回忆 起 一 些 屏幕 上 出 现 的 样子 
古怪 的 字母 和 数字 ， 其 实 这 些 神秘 的 信息 是 在 试图 向 你 显示 ， 一 个 十 六 进 制 地 址 值 指示 的 地 
方刚 刚 发 生 了 问题 。 从 现在 起 ， 蓝 屏 上 的 信息 不 仅仅 只 是 告诉 你 发 生 了 坏事 情 并 使 你 丢失 了 4 
个 小 时 的 工作 成 果 ， 而 且 你 可 以 通过 领悟 这 些 信息 ， 知 道 PC 存 储 器 的 哪些 地 方 发 生 了 非法 事 
件 。 当 然 ， 这 对 我 们 的 苦恼 几乎 没有 什么 安奈 。 

当 用 二 进 制 、 人 和 八进制 、 十 进 制 或 十 六 进 制 写 一 个 数字 上 时， 我 们 是 在 以 完全 相同 的 方式 表 
示 数 字 ， 虽 然 所 采用 的 基数 不 同 ， 数 字 看 起 来 也 很 不 一 样 。 现 在 让 我 们 考虑 一 下 十 进 制 数 
65 536， 该 数 恰好 是 2“。 在 后 面 我 们 会 明白 这 有 特殊 意义 ， 但 现在 它 只 是 一 个 数 。 图 1-15 演 
示 了 数字 65 536 的 每 一 位 是 如 何 表 示 成 列 值 乘 以 列 权 值 的 。 最 左 端 数字 ， 称 为 最 高 有 效 位 
(most significant digit) ， 是 数字 6。 最 右 端 数字 ， 称 为 最 低 有 效 位 (least significant digit)， 
恰好 也 是 数字 6。 因 为 最 高 有 效 位 的 列 权 值 是 10 000 (10?) ， 所 以 该 列 的 值 是 6x 10 000， 即 
60 000。 如 果 我 们 将 每 列 值 乘 好 ， 然 后 将 它们 排列 成 一 个 数字 列表 以 便 相 加 ， 如 图 1-15 右 边 所 
示 ， 那 么 我 们 将 它们 加 在 一 起 就 能 得 到 我 们 开始 时 所 说 的 数字 。 曙 ， 也 许 我 们 在 这 里 夸大 了 
这 种 明显 性 ， 但 别 急 ， 因 为 这 种 情况 确实 会 变 得 更 好 。 对 你 来 说 ， 这 个 小 例子 应 该 是 明显 的 ， 
因为 你 已 经 习惯 于 使 用 十 进 制 数 字 。 关 键 的 一 点 是 ， 列 权 值 恰好 是 基数 值 的 需 ， 寡 指数 的 值 
从 最 右 列 的 0 开始 ， 每 向 左 移 一 位 就 加 1。 由 于 十 进 制 的 基数 是 10， 向 左 移动 时 列 权 值 依次 就 
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是 : 1，10，100，1000，10000， 等 等 。 


*。 注意 每 一 列 是 如 何 根据 基数 值 的 寡 加 权 的 


十 





图 1-15 以 基数 10 表 示 数 字 。 从 右 向 左 ， 每 个 数字 乘 以 基数 的 寡 。 该 数字 正 是 这 些 乘 积 的 和 
如 果 能 推广 这 个 表示 数字 的 方法 ， 我 们 就 可 采用 同样 的 方法 ， 以 不 同 的 基数 表示 数字 。 


在 不 同 基数 之 间 进 行 数字 转换 


让 我 们 重复 上 面 的 演示 ， 但 这 次 将 采用 二 进 制 数 字 。 请 看 一 个 8 位 二 进 制 数 10101100， 因 
为 该 数字 有 8 位 二 进 制 数字 或 位 ， 所 以 我 们 称 之 为 8 位 数 。 习 惯 上 将 8 位 一 进 制 数 称 为 字 节 
(byte) 〈 在 C 或 C++ 中 代表 一 个 字符 ) 。 现 在 你 应 该 很 清楚 ， 为 什么 二 进 制 数 都 是 由 1 和 0 组 成 
的 了 ， 除 了 它们 恰好 是 开关 电路 (晶体管 ) 的 两 个 状态 之 外 ， 它 们 还 是 二 进 制 数 制 的 仅 有 的 
两 个 数字 。 

字 节 也 许 是 最 受 注意 的 ， 因 为 我 们 用 字 节 块 来 度量 存储 容量 。 比 如 ， 你 的 PC 中 的 存储 器 
可 能 至 少 有 256MB (2.56 亿 字 节 )， 而 你 的 硬盘 可 能 也 有 40GB (400 亿 字 节 ) 或 更 多 的 容量 。 

现在 来 看 图 1-16， 我 们 采用 的 方法 与 图 1-15 中 十 进 制 例子 中 的 相同 。 但 是 ， 这 次 列 权 值 是 
基数 2 的 倍数 ， 而 不 是 基数 10 的 倍数 。 列 权 值 从 最 高 有 效 位 2”( 即 128) 到 2" ( 即 1) ， 每 一 列 
都 比 前 一 列 小 了 二 分 之 一 。 为 了 看 看 这 个 二 进 制 数 的 十 进 制 表 示 是 什么 样 的 ， 我 们 采用 了 与 
前 面 同 样 的 过 程 ， 我 们 将 列 中 的 值 与 列 权 值 相 乘 。 


一 八进制 和 十 六 进 制 的 基数 


1 二 
0 = 
1 = 
0 = 
1 = 
1 二 
0 = 
0 = 





图 1-16 将 二 进 制 数 用 2 的 每 表示 。 注 意 八 (8) 进 制 和 十 六 (16) 进 制 的 基数 也 是 2 的 宕 


于 是 ,我们 断定 十 进 制 数 172 等 于 二 进 制 数 10101100。 另 外 ， 值 得 注意 的 是 ， 十 六 进 制 数 
制 的 基数 16 和 八进制 数 制 的 基数 8 分 别 等 于 2* 和 2 。 这 也 许可 以 给 你 一 个 暗示 ， 那 就 是 当 我 们 
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和 计算 机 系统 打交道 时 ， 为 什么 通常 用 十 六 进 制 表示 ， 偶 尔 也 用 八进制 表示 ， 但 却 不 用 二 进 
制 表示 。 理 由 很 简单 ， 写 二 进 制 数字 很 快 就 会 极其 单调 乏味 ， 并 很 容易 犯人 为 错误 。 
眼见 为 实 ， 考 虑 十 进 制 数 的 二 进 制 形式 : 
2 098 236 812 
这 个 数 用 二 进 制 数 将 写成 : 
1111101000100001000110110001100 


由 于 二 进 制 数字 非 0 即 1， 所 以 通过 图 1-16 所 示 的 过 程 ， 二 进 制 数 能 特别 容易 地 转换 成 十 
进 制 数 。 这 对 于 我 们 中 那些 记 不 住 乘法 表 的 人 (PDA 的 使 用 已 经 使 我 们 大 脑 皮 层 的 重要 部 分 
雁 缩 了 ) 来 说 ， 乘 法 变 得 容易 了 。 

由 于 基数 2、8 和 16 之 间 存 在 着 关联 ， 所 以 ， 一 个 合理 的 假设 就 是 在 这 三 个 数 制 之 间 进 行 
数字 转换 要 比 它们 与 十 进 制 之 间 进 行 数字 转 换 更 容易 ， 因 为 10 不 是 2 的 自然 数 寡 。 图 1-17 展 示 
了 如 何 将 二 进 制 数 转换 成 八进制 数 。 


4x80= 4 
5x81= 40 
2x82=128 


172 





图 1-17 将 二 进 制 数 转换 成 八进制 数 。 通 过 提取 基数 值 ， 我 们 能 将 二 进 制 数 
结合 成 3 个 数字 的 组 ， 并 通过 观察 写 出 八进制 数 
图 1-17 更 进一步 地 利用 了 图 1-16 的 例子 。 图 1-17 从 同一 个 二 进 制 数 10101100 ( 即 十 进 制 数 
172) 开始 。 然 而 通过 简单 的 算术 ,我们 可 以 提取 出 2 的 各 种 矫 ， 而 该 备 同 时 也 是 8 的 矫 。 请 看 
图 1-17 中 的 深 灰 带 ， 我 们 可 做 如 下 简化 : 
由 于 任何 数字 的 0 次 寡 都 等 于 1， 
(22212°) =2° x 【到 大 2 
所 以 ， 
交友 8 三 
我 们 可 以 对 下 一 组 的 3 个 二 进 制 数字 做 同样 的 简化 
(25225 = 23x (222'2°) 
因为 2 是 该 组 的 公 因子 。 
但 是 ，2” = 8'， 这 是 八进制 数 制 中 下 一 列 的 列 权 值 。 
如 果 对 最 后 两 个 数字 的 组 再 一 次 重复 该 过 程 ， 那 么 我 们 会 看 到 
( 2229 = 26 x (2120) 
. 因为 2 是 该 组 的 公 因 子 。 同 样 ，25 = 82?， 这 正 是 八进制 数 制 中 下 一 列 的 列 权 值 。 
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由 于 基数 8 和 基数 2 之 间 有 这 种 自然 的 关系 ， 所 以 在 这 两 个 数 制 之 间 进 行 数 字 转 换 就 变 得 
很 容易 了 。 对 每 一 组 的 3 个 二 进 制 数字 ， 从 最 右边 (最低 有 效 位 ) 开始 ， 通 过 简单 地 将 二 进 制 
值 写成 相等 的 0 到 7 之 间 的 八进制 数字 ， 就 可 以 转换 成 为 八进制 值 。 在 图 1-17 中 ， 最 右 一 组 3 位 
二 进 制 数字 是 100， 参 照 列 权 值 ， 可 转换 为 1 x (1x4 + 0x2 +0x1)， 即 4。 中 间 一 组 3 位 二 
进 制 数字 可 转换 为 8x (1x4 + 0x2 + 1x1)， 即 8 x 5(40)。 剩 下 的 两 个 数字 转换 为 : 64 x (1 
x2+0x1)， 即 128。 于 是 有 ，4 + 40 + 128 = 172， 这 也 是 图 1-16 中 的 十 进 制 数 。 但 是 八进制 
数 在 哪里 呢 ? 很 简单 ， 每 3 个 一 组 的 二 进 制 数字 就 给 了 我 们 八进制 数 的 列 值 ， 即 为 2354。 因 此 ， 
二 进 制 数 10101100 就 等 于 八进制 数 254， 也 等 于 十 进 制 数 172。 
很 好 ! 这 样 我 们 就 能 按照 如 下 方法 进行 二 进 制 和 八进制 之 间 的 转换 了 : 
。 如 果 数 字 是 八进制 的 ， 就 将 每 个 八进制 数字 写成 3 个 二 进 制 数字 。 例 如 : 
256773 = 10 101 110 111 111 011 

。 如 果 数 字 是 二 进 制 的 ， 就 从 最 低 有 效 位 开始 ， 将 这 些 二 进 制 数字 分 成 3 个 一 组 ， 并 写 下 
相等 的 八进制 数字 (0~7)。 例 如 : 
110001010100110111。 = 110 001 010 100 110 111 = 612467。 

。 如 果 最 高 有 效 位 所 在 组 只 留 下 了 一 位 或 两 位 数字 ， 那 么 只 需 用 0 填补 ， 以 使 其 成 为 3 个 

数字 的 组 。 

目前 ， 虽 然 八 进 制 不 像 以 前 那样 经 常 使 用 了 ， 但 你 偶尔 还 是 会 遇 到 。 例 如 ， 在 UNIX 
(Linux) 命令 chmod 777 中 ， 数 字 777 就 是 各 个 位 的 八进制 表示 ， 用 于 定义 文件 状态 。 该 命 
令 为 将 要 访问 文件 的 用 户 改 变 文件 的 许可 状态 。 

现在 我 们 可 以 扩展 有 关 二 进 制 数字 和 八进制 数字 之 间 关 系 的 讨论 了 ， 从 而 进一步 考虑 二 
进 制 和 十 六 进 制 之 间 的 关系 。 十 六 进 制 (hex) 数字 与 二 进 制 之 间 的 转换 方法 和 八进制 与 二 进 
制 之 间 的 转换 方法 相同 ， 只 不 过 我 们 现在 是 用 2“ 而 不 是 2 来 做 公 因子 。 如 图 1-18 所 示 ， 可 以 看 
到 向 十 六 进 制 转换 与 向 八进制 转换 所 采用 的 过 程 相 同 。 





图 1-18 将 二 进 制 数 转换 成 基 为 16 (十 六 进 制 ) 的 数 。 从 最 低 有 效 位 开始 ， 
二 进 制 数 分 成 4 个 一 组 ， 并 通过 观察 写 下 相等 的 十 六 进 制 数字 


在 这 种 情况 下 ， 我 们 提取 出 基数 的 公共 敌 2*?， 剩 下 的 就 是 将 二 进 制 数字 分 组 ， 用 列 值 表 
示 为 : 
2°2521230 
很 容易 看 出 ， 二 进 制 数 1111 = 15io， 因 此 4 个 二 进 制 数字 的 组 就 可 用 于 表示 0~15 之 间 的 一 
个 十 进 制 数字 ， 或 0~F 之 间 的 一 个 十 六 进 制 数 字 。 回 过 头 来 再 看 图 1-16， 既 然 我 们 知道 了 如 何 


做 转换 ， 那 么 与 10101100 相 同 的 十 六 进 制 数 是 什么 呢 ? 最 左边 的 一 组 4 位 二 进 制 数字 1010 正 好 _- 


是 g+0+2+0， 即 A。 最 右边 的 一 组 4 位 二 进 制 数字 1100 等 于 y +4+0+0， 即 C。 因 此 ， 该 数 
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的 十 六 进 制 形式 是 AC。 
让 我 们 做 一 个 16 位 二 进 制 数 转换 的 例子 。 

二 进 制 数 0 101 111 111 010 111 

八进制 数 0 101 111 111 010 111 = 057727 (3 个 数字 一 组 ) 

十 六 进 制 数 0101 1111 1101 0111 = 5FD7 (4 个 数字 一 组 ) 

十 进 制 数 要 转换 到 十 进 制 ， 见 下 表 。 

八进制 转换 到 十 进 制 十 六 进 制 转换 到 十 进 制 

7x8o=7 7x16°=7 
2x8l=16 13 x 161 = 208 
7x82=448 15 x 16? = 3840 
7x83= 3584 5x 16? = 20480 
5x 84 = 20480 
24,535 24,535 





定义 


在 考虑 将 十 进 制 转换 到 十 六 进 制 、 八 进 制 、 二 进 制 这 种 反 向 转换 过 程 之 前 ， 我 们 应 定义 
一 些 术语 。 这 些 术语 为 计算 机 数字 所 专用 ， 且 为 我 们 在 以 后 表示 数字 大 小 给 出 了 一 种 速记 方 
式 。 这 里 所 说 的 “大 小 "， 并 不 是 指数 字 的 大 小 ， 而 是 指数 字 的 二 进 制 位 数 。 你 已 经 熟悉 这 个 
概念 了 ， 因 为 大 多 数 编译 器 都 要 求 你 在 使 用 变量 前 先 声明 其 类 型 。 声 明 类 型 实际 上 意味 着 要 
做 两 件 事 : 

1. 该 变量 要 占用 多 少 存储 空间 ? 

2. 必须 生成 什么 类 型 的 汇编 语言 算法 来 操作 这 个 数 ? 

下 表 总 结 了 二 进 制 位 的 各 种 分 组 及 其 定义 。 











位 (bit) 最 简单 的 二 进 制 数字 是 1 位 长 

半 字 节 (nibble) 包含 4 个 二 进 制 位 的 数字 。 一 个 半 字 节 也 是 一 个 十 六 进 制 数字 位 

字 节 (byte) 8 个 二 进 制 位 一 起 构成 一 个 字 节 。 字 节 是 度量 计算 机 存储 器 和 磁盘 存储 容量 
的 基本 单位 。 字 节 在 C 和 C++ 中 也 等 价 于 一 个 字符 

字 (word) 一 个 字 的 长 讼 是 16 个 二 进 制 位 。 这 也 是 4 个 十 六 进 制 数字 或 2 个 字 节 的 长 度 。 


当 我 们 谈论 存储 器 组 成 时 ， 这 个 概念 将 会 变 得 更 重要 。 在 C 或 CH+ 中 ,， 字 有 时 
也 称 为 短 整 数 (short) 


也 称 为 长 数 (LONG)， 长 字 是 32 个 二 进 制 位 或 8 个 十 六 进 制 数字 。 目 前 ， 这 
在 C 和 C++ 中 就 是 一 个 整数 (int) 


也 称 为 双 数 (DOUBLE)， 双 数 是 64 个 二 进 制 位， 或 者 16 个 十 六 进 制 数字 





长 字 (long word ) 





双 字 (double word) 


从 该 表 中 你 可 能 得 到 这 样 一 个 线索 ， 就 是 为 什么 八进制 表示 已 大 多 被 十 六 进 制 表示 所 取 
代 。 这 是 因为 八进制 是 由 3 位 二 进 制 数组 成 的 ， 所 以 我 们 通常 要 处 理 令 人 烦恼 的 余下 位 数 ， 因 
此 ， 我 们 似乎 总 是 会 看 到 在 最 高 的 八进制 有 效 位 上 有 额外 的 1 个 、2 个 或 3 个 二 进 制 位 。 如 果 计 
算 机 的 设计 者 决定 用 15 位 和 33 位 而 不 是 用 16 位 和 32 位 作为 总 线 宽 ， 那 么 也 许 八进制 还 会 存在 
并 活跃 着 。 另 外 ， 十 六 进 制 是 更 为 紧凑 的 数字 表示 方式 ， 因 此 它 成 为 目前 的 标准 。 图 1-19 总 
结 了 各 种 数据 元 素 目前 的 长 度 和 不 久 的 将 来 有 可 能 会 用 到 的 长 度 。 
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让 丰 DN 


口 位 (1) 


D3 _D0 
半 字 节 (4) 


梧 辐 字 节 (8) 





图 1-19 计算 机 系统 中 各 种 数据 元 素 的 长 度 


目前 ， 我 们 已 经 有 了 能 在 一 个 操作 中 对 64 位 数 进行 操纵 的 计算 机 。Advanced Micro 
Devices 公 司 的 Athlon64@ 就 是 一 种 这 样 的 处 理 器 。 另 一 个 例子 是 任天堂 的 N64 Game Cube@ 中 
的 处 理 器 。 还 有 ， 如 果 你 认为 自己 是 一 个 PC 游戏 者 ， 你 喜欢 在 PC 上 玩 快 动作 的 视频 游戏 ， 那 
么 在 你 的 游戏 机 上 就 可 能 具有 一 个 高 性 能 的 视频 卡 。 很 可 能 你 的 视频 卡 上 具有 一 个 视频 处 理 
计算 机 芯片 ， 能 够 一 次 处 理 128 位 。256 位 的 处 理 器 还 会 远 吗 ? 


小 数 
我 们 处 理 小 数 的 方式 与 处 理 整 数 的 方式 相同 。 例 如 ， 考 虑 图 1-20。 


102 10! 10° 107 1072 10 10-% 
和 6 7 4 3 1 


图 1-20 表示 基数 为 10 的 小 数 


我 们 看 到 对 于 一 个 十 进 制 数 ， 小 数 点 右边 的 列 以 10 的 负 整数 寡 增长 ， 所 以 我 们 可 将 刚 学 
到 的 基数 间 的 转换 方法 应 用 于 小 数 的 转换 。 但 既然 说 到 这 里 ， 就 应 提 及 在 计算 机 中 小 数 通常 
并 不 是 这 样 表示 的 。 任 何 小 数 都 将 立刻 被 转换 成 浮 点 数 ， 即 poat。 浮 点 数 有 其 自己 的 表示 方 
法 ， 典 型 的 表示 是 包含 尾数 和 指数 的 64 位 值 。 我 们 将 在 后 面 的 章节 中 讨论 浮 点 数 。 


二 进 制 编码 的 十 进 制 


出 于 完整 性 考虑 ， 还 有 最 后 一 种 形式 的 二 进 制 表示 我 们 应 该 顺便 提 及 一 下 。 在 计算 机 发 
展 的 早期 ， 当 需要 对 来 自 数字 逻辑 仪器 的 数据 (而 不 是 现今 基于 计算 机 的 数据 ) 进行 转换 时 ， 
将 数字 表示 成 二 进 制 编码 的 十 进 制 (binary coded decimal, BCD) 更 为 方便 。 一 个 BCD 数 可 以 
表示 成 4 个 二 进 制 数字 ， 就 像 一 个 十 六 进 制 数 ， 不 同 之 处 在 于 最 大 数字 是 9 而 不 是 F。 计 算 器 和 
仪表 等 装置 采用 BCD 的 原因 是 它 是 一 种 将 数字 值 与 某 种 显示 装置 (如 7- 段 显示 器 ) 相关 联 的 
方便 途径 。 图 1-21 给 出 了 7- 段 显示 器 所 显示 的 数字 。 
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7- 段 显示 器 包含 7 个 棒 条 ， 通 常 还 有 一 个 小 数 点 ， 每 个 元 素 都 是 通过 发 光 二 极 管 (LED) 
发 亮 。 图 1-21 示 意 出 7- 段 显示 器 如 何 用 


于 显示 0 到 9 的 数字 。 事 实 上 ， 稍 加 创 
新 ， 也 能 显示 A 到 F 的 十 六 进 制 数字 。 
BCD 是 将 数字 计数 器 和 电压 表 数 
00 010 


据 转 换 成 显示 器 上 易 读 数字 的 简便 方 “00 0001 10 0011 0100 


式 。 想 像 一 下 ， 如 果 Radio Shack@ 电 进位 1 一 
乓 的 读 娄 旦 7AV 电 压 ， 而 不 是 122V 3 7 
电压 ， 那 么 你 会 有 什么 反应 。 图 1-21 |_| 
表明 了 当 我 们 用 BCD 计 数 时 会 发 生 什 0110 0111 1000 1001 0001 ”0000 
么 。 显 示 的 数字 对 于 我 们 是 有 意义 的 ，。 图 1-21 二 进 制 编码 的 十 进 制 (BCD) 数 表示 。 如 果 数字 起 
因为 它们 看 起 来 像 十 进 制 数字 。 当 计 过 计数 9， 就 发 生 进位 操作 ， 二 进 制 数字 返回 到 0 
数 达 到 1001 (9) 时 ， 下 一 次 的 加 1 就 

会 使 显示 器 返回 到 显示 0 并 进位 1， 而 不 是 显示 A。 现 今 的 很 多 微 处 理 器 还 带 有 从 BCD 到 十 六 
进 制 数 转换 时 期 的 痕迹 ， 这 可 以 从 它 所 包含 的 特殊 指令 看 出 来 ， 例如， 十 进 制 加 法 调整 
(decimal add adjust) 指令 ， 用 于 为 实现 BCD 算 术 运 算 产生 算法 。 


1.4 将 十 进 制 数 转换 为 各 种 基数 的 数 


将 十 进 制 数 转 换 为 二 进 制 、 八 进 制 或 十 六 进 制 稍 有 些 辐 手 ， 因 为 基数 10 与 任何 其 他 基数 
都 设 有 自然 的 关系 。 然 而 ， 转 换算 法 是 一 个 十 分 简单 的 过 程 。 例 如 ， 让 我 们 将 十 进 制 数 38 070 
转换 成 十 六 进 制 数 。 

1. 找到 基数 中 最 大 的 〈 本 例 是 16) ， 将 其 对 某 个 尽量 大 的 整数 求 寡 ， 使 得 赛 值 小 于 你 要 做 
转换 的 数 。 为 了 做 此 转换 ， 我 们 需要 参考 如 下 所 示 的 16 的 寡 值 表 。 从 表 中 我 们 看 到 38 070 大 
于 4 096 但 小 于 65 536。 因 此 我 们 知道 转换 的 最 大 列 值 是 16?。 





160 = 1 161= 16 16? = 256 163 = 4096 





164 = 65 536 165 = 1 048 576 166 = 16 777 216 167 = 268 435 456 


2. 对 数字 执行 整数 除法 操作 : 
a. 38 070 DIV 4096 =9 
b. 38 070 MOD 4096 = 1206 
3. 最 高 有 效 十 六 进 制 位 就 是 9。 用 步骤 2 所 得 到 的 MOD (余数 ) 重复 步骤 1。256 小 于 1206 
而 4096 大 于 1206。- 
a. 1206 DIV 256 = 4 
b. 1206 MOD 256 = 182 
4. 这 样 次 一 位 的 最 高 有 效 位 就 是 4。 用 步骤 3 所 得 到 的 MOD 重 复 步 又 2。182 大 于 16 而 小 于 256。 
a.182 DIV16=11 (B) 
b.182 MOD 16 =6 
5. 第 三 个 最 高 有 效 位 就 是 B。 到 此 我 们 就 可 停止 了 ， 因为 最 低 有 效 位 可 通过 观察 得 出 ， 为 6。 
6. 因此 有 : 38 07016 = 94B616。 
在 我 们 转 入 下 一 个 话题 ( 即 逻 辑 门 ) 之 前 ， 有 必要 总 结 一 下 我 们 讲解 这 些 内 容 的 原因 。 当 
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要 用 32 位 二 进 制 数 写 下 一 个 数字 时 ， 如 果 你 能 意识 到 有 更 好 的 方式 ， 那 么 就 不 用 写 很 长 的 数字 
了 。 更 好 的 方式 就 是 十 六 进 制 和 八进制 。 因 为 十 六 进 制 数 和 八进制 数 的 基数 分 别 为 16 和 8， 所 
以 它们 与 二 进 制 的 基数 2 有 着 自然 的 关系 。 我 们 可 以 通过 将 二 进 制 数字 结合 成 3 个 一 组 或 4 个 一 
组 来 简化 数字 操作 ， 这 样 ， 我 们 就 能 将 32 位 二 进 制 数 如 10101010111101011110000010110110 
写成 十 六 进 制 数 AAF5E0B6。 

但 是 ,请 记 住 我 们 仍然 是 在 处 理 二 进 制 值 ， 只 是 用 来 表示 这 些 数 字 的 方式 有 所 不 同 而 已 。 
稍 后 你 将 会 看 到 ， 这 种 二 进 制 和 十 六 进 制 之 间 的 自然 关系 也 可 延伸 到 算术 操作 。 为 证 明 这 一 
点 ， 可 进行 如 下 的 十 六 进 制 加 法 : 

0B+1A = 25 〈 记 住 ，25 是 十 六 进 制 的 ， 不 是 十 进 制 的 。 十 六 进 制 的 25 就 是 十 进 制 的 37。) 

现在 ， 再 将 0B8 和 1A 转 换 到 二 进 制 并 做 同样 的 加 法 。 注 意 在 二 进 制 中 ，1+1=0， 并 产生 
进位 1。 

由 于 用 十 六 进 制 、 二 进 制 和 八进制 很 容易 对 数字 产生 误解 ， 所 以 汇编 器 和 编译 器 允许 我 
们 容易 地 规定 数字 的 基数 。 在 C 和 C++ 中 ， 我 们 将 十 六 进 制 数 如 AA55 表 示 成 0xXAA55。 在 汇编 
语言 中 ,我们 采用 的 是 美元 符号 ， 这 样 该 数 在 汇编 语言 中 就 是 $AA55。 然 而 ， 由 于 汇编 语言 
没有 一 个 像 ANSI C 那 样 的 标准 ， 所 以 不 同 的 汇编 器 可 能 会 使 用 不 同 的 符号 。 另 一 个 常用 的 方 
法 是 ， 如 果 最 高 有 效 位 是 A 到 F 的 数字 ， 那 么 可 以 在 十 六 进 制 数 之 前 加 一 个 0， 最 后 附加 一 个 
“H 。 这 样 ，$AA55 在 一 个 不 同 供应 商 的 编译 器 中 就 可 能 被 表示 为 0AA55H。 


1.5 工程 符号 


虽然 大 多 数学 生 都 学 习 过 用 科学 符号 来 表示 很 大 或 很 小 的 数字 的 基本 方法 ， 但 不 是 所 有 
的 人 都 学 习 过 如 何 对 科学 符号 做 某 些 推广 ， 以 简化 我 们 在 数字 系统 中 要 处 理 的 一 些 常 用 数量 
的 表达 。 因 此 ， 让 我 们 暂时 离开 主题 来 讨论 一 下 这 个 课题 ， 以 便 使 我 们 有 一 个 共同 的 起 点 。 
你 车 已 经 知道 了 这 些 知识 ， 那 么 你 可 以 提早 大 约 10 分 钟 结束 本 章 的 学 习 了 。 

工程 符号 仅仅 是 对 极 大 数字 或 极 小 数字 的 一 种 速记 表示 ， 是 一 种 有 助 于 工程 人 员 进 行 简 
便 交流 的 格式 。 让 我 们 来 看 一 个 例子 ， 这 个 例子 来 自 于 许多 年 前 我 从 电视 上 看 到 的 一 个 关于 
蝙蝠 的 自然 类 节 上 自 。 蝙 蝠 在 绝对 黑 瞳 中 利用 它们 所 发 出 的 超声 波 回声 来 定位 昆虫 ， 昆虫 反射 
声波 脉冲 ， 蝙 蝠 就 能 定位 食物 。 我 尤其 记得 讲述 者 说 ， 蝙 蝠 的 神经 系统 是 如 此 地 精 于 回声 定 
位 ， 它 能 分 辨 出 小 于 百 万 分 之 几 秒 间 隔 内 到 来 的 声波 脉冲 。 哇 ! 

但 是 ,，“ 百 万 分 之 几 ” 意 味 着 什么 昵 ?车 我 们 说 百 万 分 之 儿 秒 是 百 万 分 之 五 秒 ， 那 就 是 
0.000005 秒 ， 科 学 符号 中 0.000005 秒 可 写成 5 x 10“ 秒 。 工 程 上 的 记 法 是 Sus， 读 成 5 微 秒 ， 我 
们 采用 和 希 文 符 号 uw (mu) 来 表示 微 秒 的 “ 微 ” 这 部 分 意思 。 我 们 常常 遇 到 的 符号 有 哪些 呢 ? 
下 表 列 出 了 一 些 常用 的 值 : 





太 (tera) = 10'? (T) 皮 (pico) = 10 1!2 (p) 
吉 (giga) = 10? (G) 纳 (nano) = 10-9 (n) 
兆 (mega) = 108 (M) 微 (micro) = 107™ (1) 
于 (kilo) = 10? (K) 训 (milli) = 10-3 (m) 

飞 (femto) =10-'s (f) 


既然 这 样 ， 那 么 我 们 如 何 将 科学 符号 转换 成 等 价 的 工程 符号 呢 ? 下 面 就 是 转换 方法 ， 
1. 调整 尾数 和 指数 ， 使 得 指数 可 被 3 整除 ， 而 尾数 不 是 小 数 。 这 样 ，3.05 x 104 字 节 就 要 成 
了 30.5 x 103 而 不 是 0.03 x 106。 





[26] 
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2. 将 指数 项 用 适当 的 名 称 替代 。 这 样 ，30.5 x 10 宇 节 就 是 30.5K 字 节 ， 或 者 30.5 千 字 节 。 

在 99.99% 的 时 候 ， 指 数 范围 在 土 12 之 内 。 然 而 ， 随 着 计算 机 越 来 越 快 ， 我 们 将 会 在 皮 秒 
以 内 来 度量 时 间 ， 所 以 将 飞 秒 包 括 进 表 中 也 是 适当 的 。 作 为 一 个 练习 ， 请 计算 一 下 在 1 飞 秒 
内 光 能 传播 多 远 ， 假设 光 在 印刷 电路 板 上 的 传播 速度 大 约 是 每 纳 秒 15cm。 

虽然 在 较 早 时 我 们 讨论 了 这 个 问题 ， 但 在 这 里 还 是 应 该 再 强调 一 下 ， 当 使 用 kilo、mega、 
giga 这 些 工程 术语 时 ， 我 们 必须 要 谨慎。 这 个 问题 是 计算 机 界 的 人 不 适当 地 将 标准 工程 符号 
为 已 所 用 而 造成 的 。 由 于 2" = 1024， 所 以 计算 机 界 的 “请 稽 表 演 者 ”就 认为 它 与 1000 非 常 接 
近 ， 由 此 ， 符 号 KE、M、G 就 分 别 承载 了 1024、1048576、1073741824 的 意思 ， 而 不 是 1000、 
1000000、1000000000 的 意思 了 。 

幸运 的 是 ， 我 们 很 少 混 应 ， 因 为 计算 机 的 定义 通常 局 限于 对 有 关 存 储 器 大 小 或 字 节 容量 的 
度量 。 当 度量 任何 其 他 事物 的 时 候 (如 时 钟 速度 或 时 间 )， 我 们 就 采用 这 些 单位 的 传统 意义 。 


总 结 


。 集 成 电路 微 处 理 器 制造 技术 的 进步 促使 现代 数字 计算 机 迅速 发 展 。 

。 计算 机 存储 器 的 速度 与 其 容量 具有 反比 关系 。 存 储 器 速度 越 快 ， 它 就 越 接近 于 计算 机 
的 核心 。 

。 现代 计算 机 基于 两 个 基本 设计 : CISC 和 RISC，。 

。 由 于 电子 电路 可 在 “ 开 ” 与 “ 关 ” 之 间 快 速 转换 ， 所 以 计算 机 可 以 采用 二 进 制 数 制 
( 即 基 数 为 2) ， 而 不 是 采用 其 他 自然 数 的 数 制 。 

。 二进制 、 八 进 制 和 十 六 进 制 是 计算 机 的 自然 的 基数 ， 在 它们 之 间 以 及 它们 与 十 进 制 数 
之 间 有 简单 的 转换 方法 。 
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习题 

1. 定义 摩尔 定律 。 摩 尔 定律 在 理解 计算 机 性 能 的 发 展 趋 势 方面 有 哪些 语意 ? 限制 你 的 答案 不 
要 超过 两 段 。 

2. 假设 在 2004 年 1 月 ，AMD 发 布 了 一 款 新 的 具有 1 亿 个 晶体 管 的 微 处 理 器 ， 那 么 根据 摩尔 定律 ， 
AMD 将 在 什么 时 候 发 布 具 有 2 亿 个 晶体 管 的 微 处 理 器 。 

3. 对 于 采用 抽象 层次 的 计算 机 组 织 ， 描 述 其 一 个 优点 和 一 个 缺点 。 

4. 什么 是 典型 PC 机 的 工业 标准 总 线 ? 

5. 假设 平均 存储 器 访问 时 间 是 35ns ( 纳 秒 ) ， 平 均 硬盘 访问 时 间 是 12ms (毫秒 ) ， 那 么 ， 半 导 
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体 存储 器 比 硬盘 存储 器 快 多 少 ? 
.十 进 制 数 357 用 基数 为 9 表示 是 什么 ? 
. 将 下 面 的 十 六 进 制 数 转换 成 十 进 制 数 : 
(a) OxFES7 
(b) OxA3011 
(c) OxDEO1 
(d) 0x3AB2 
8. 将 下 面 的 十 进 制 数 转换 成 二 进 制 数 : 
(a) 510 
(b) 64 200 
(c) 4 001 
(d) 255 
9. 假设 你 正 以 两 星期 14 弗 隆 (furlong， 长 度 单位 ，1 弗 隆 =660 英 尺 ) 的 速度 旅行 ， 那 么 每 秒 你 
旅行 多 少 英尺 ? 用 工程 符号 表示 你 的 答案 。 


-Oo 





第 2 章 数字 逻辑 简介 


学 习 目 标 

”了 解数 字 有 逻辑 门 的 电路 基础 ; 

。 理解 现代 CMOS 弥 辑 电路 的 工作 原理 ， 
。 熟悉 各 种 逻辑 门 电路 。 


2.1 引言 


还 记得 图 1-14 中 简单 的 电 字 和 闪光 灯 电 路 吗 ? 其 中 用 线 串 连 起 来 的 两 个 开关 实现 了 逻辑 
“与 ”(AND) 的 功能 。 这 个 例子 表达 的 意思 是 ,“ 如 果 开 关 A 闭 合并 且 开 关 B 闭 合 ， 那 么 灯泡 
C 就 会 亮 .” 毫 无 疑问 ， 这 个 电路 远 比 我 们 用 的 电脑 简单 得 多 ， 但 其 中 两 个 开关 实现 的 逻辑 功 
能 却 是 构成 现代 计算 机 的 4 个 关键 元 件 之 一 。 

说 出 来 可 能 让 人 惊讶 ， 现 代 计算 机 所 有 的 主要 数字 元 件 ， 如 中 央 处 理 单元 (CPU)、 存 储 
器 和 W/O 设备 都 可 以 由 4 个 基本 有 逻辑 功能 构造 出 来 : 与 AND)、 或 (OR)、 非 (NOT) 和 三 态 
(Tri-State, TS)。 其 实 “ 三 态 ” 并 不 是 一 个 逻辑 功能 ， 它 更 接近 于 一 种 电子 电路 实现 工具 。 但 
车 没有 三 态 逻 辑 ， 就 不 可 能 建造 出 现代 计算 机 。 

我 们 即将 看 到 ， 三 态 逻 辑 引 入 了 一 个 称 为 高 阻 (Hi-Z) 的 第 三 种 逻辑 条 件 ， 这 里 “Z” 是 


阻抗 的 电路 符号 ， 找 述 的 是 电流 流入 电路 的 难 易 程度 ， 因 此 ， 高 阻 似乎 意味 着 对 电流 有 很 大 


的 阻碍 作用 。 后 面 将 说 明 ， 高 阻 对 建造 整个 系统 非常 关键 。 

前 面 说 过 ， 我 们 可 以 使 用 4 个 基本 逻辑 门 : 与 、 或 、 非 和 三 态 ， 从 下 至 上 地 建造 出 一 台 计 
算 机 。 但 这 并 不 意味 着 我 们 就 将 直接 使 用 它们 。 其 原因 在 于 ， 工 程 师 们 通常 使 用 一 些 现成 的 
模块 来 设计 更 复杂 的 电路 ， 而 这 种 有 效率 的 设计 方法 将 使 得 基本 电路 元 件 间 的 区 别 变 得 模糊 。 
但 是 ， 这 并 不 能 抹 和 化 这 4 种 基本 逻辑 功能 在 概念 上 的 重要 性 。 

写 到 这 里 ， 我 突然 想到 了 DNA 分 子 和 
计算 机 的 相似 性 ， 并 为 它 所 打动 。DNA 分 
子 有 4 种 核 攻 酸 ， 逐 嘿 哈 、 胞 罚 喧 、 乌 嘿 险 
和 胸腺 喀 啶 (分别 简写 为 A、C、G 和 T)， 
而 计算 机 也 可 以 由 4 种 “电子 核 背 酸 ” 来 描 
述 。 我 们 也 不 要 太 惊 讶 这 种 巧合 ， 因 为 它 
们 之 间 的 区 别 远 远大 于 这 种 相似 性 。 无 论 
如 何 ， 想 像 将 来 有 一 种 “电子 DNA 分 子 ” 
是 多 么 有 趣 ， 它 可 用 来 作为 复制 自己 的 蓝 
本 。 会 有 一 本 关于 这 个 想法 的 科幻 小 说 
吗 ? 图 2-1 解 释 了 DNA 和 计算 机 硬件 基本 元 ”图 2-1 假想 一 个 计算 机 由 左边 的 “逻辑 DNA” 建造， 而 
件 之 间 的 类 似 关 系 。 右边 是 一 个 真实 DNA 分 子 结构 图 的 一 部 分 (DNA 

关于 与 DNA 的 相似 性 就 说 这 么 多 ! 我 分 子 图 片 来 自 冷泉 港 实验 室 的 Dolan 学 习 中 心 ') 
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们 继续 新 的 内 容 。 在 谈 新 内 容 之 前 ， 我 要 做 最 后 一 点 说 明 。 造 成 这 种 相似 性 的 关键 在 于 ， 从 
现在 开始 我 们 在 数字 硬件 领域 要 做 的 所 有 事情 都 将 基于 这 4 种 基本 的 逻辑 功能 。 这 样 做 可 能 不 
会 很 容易 ， 但 却 是 我 们 面临 的 事情 。 

图 2-2 是 一 个 可 执行 逻辑 “与 ”功能 的 数字 逻辑 门 的 示意 图 。 图 中 标 为 F(A, B) 的 符号 是 
数字 电路 设计 中 表示 与 门 的 标准 记号 。 输 出 C 是 两 个 二 进 制 输入 变量 A 和 B 的 函数 。A 和 B 都 
是 二 进 制 变 量 ， 但 在 这 个 电路 中 它们 是 由 电压 值 来 表示 的 。 正 逻辑 (positive logic) 是 指 
正 ( 较 高 ) 电压 表示 “1”， 而 非 正 〈 较 低 ) 的 电压 表示 “0”。 在 正 逻 辑 下 ， 与 门 常 被 用 于 
这 样 的 电路 ， 其 中 丈 辑 “0” 用 0~0.8V 范 围 的 电压 表示 ,“1” 则 由 大 约 在 3.0V 和 5.0VS 之 间 
的 电压 表示 。0.8~3.0V 之 间 是 “无 人 区 ”， 信 号 值 上 下 变化 时 经 过 这 个 区 间 的 速度 非常 快 ， 
不 会 停留 下 来 。 如 果 测 量 出 一 个 逻辑 值 的 电压 在 这 个 区 域内 ， 那 么 这 个 电路 里 一 定 有 一 个 
电学 错误 。 


图 2-2 所 示 的 逻辑 函数 可 以 有 门 函数 
几 种 等 价 的 表达 方式 : A 

。 如 果 A 为 真 且 B 为 真 ， 那么 C 。 C= F(AB) 
为 真 a ~、 

。 如 果 A 为 高 电压 且 B 为 高 电 与 门 的 输入 信号 与 门 的 输出 
压 ， 那 么 C 也 是 高 电压 信号 

。 如果 A 为 1 且 B 为 1， 那 么 C 图 2-2 逻辑 与 门 。 与 门 是 对 两 个 输入 值 A 和 B 实 现 逻 辑 
也 是 1 与 功能 的 电子 开关 电路 


。 如果 A 开启 且 B 开 启 ， 那 么 C 也 为 开启 状态 

。 如 果 A 处 电压 为 5SV 且 B 处 电压 为 SV， 那 么 C 处 电压 也 为 SV 

最 后 一 项 有 点 问题 ， 因 为 我 们 是 允许 电压 值 在 一 定 范 围 内 变化 ， 而 不 是 一 个 绝对 的 数值 。 
但 在 这 里 ,说 “5V” 比 说 “3V~5V 的 范围 ”要 简洁 得 多 。 

如 我 们 在 上 一 章 所 讨论 的 ，A 和 B 在 实际 电路 中 都 是 单个 线 上 的 信号 。 这 些 线 可 以 是 用 于 
形成 电路 的 实际 导线 ， 也 可 以 是 图 1-11 所 示 的 印刷 电路 板 (PC) 上 的 特别 细 的 钢 线 ( 轨 )， 甚 
至 还 可 以 是 一 个 集成 电路 芯片 中 的 用 显微镜 才能 看 到 的 互 连 线 。 无 论 哪 种 情况 ， 它 都 是 一 根 
传递 数字 信号 的 线 ， 而 这 个 信号 的 值 只 有 两 种 可 能 :“0” 或 者 “1”。 

我 们 要 考虑 的 下 一 个 问题 是 ， 为 什么 我 们 称 这 个 电路 元 件 为 “ 门 ”"。 你 可 以 想像 一 下 现实 
生活 中 你 家 门口 的 那个 门 ， 任 何人 要 进 你 家 都 必须 打开 这 个 门 。 与 门 也 可 以 按 同样 的 方式 来 
理解 ， 它 是 逻辑 信号 通路 上 的 一 个 门 。 虽 然 前 面 的 列表 把 与 门 描述 成 了 一 个 个 逻辑 语句 ， 然 
而 我 们 也 可 以 这 么 来 描述 它 : 

。 如 果 A 为 1， 那 么 C 等 于 B 

。 如 果 人 A 为 0, :那么 C 等 于 0 

当然 ， 我 们 可 以 在 上 面 的 表述 中 交换 A 和 B， 因 为 这 两 个 输入 是 对 等 的 。 上 述 含 义 也 可 以 
用 图 2-3 来 表示 。 注 意 输入 B 和 输出 C 处 那些 奇怪 的 折线 ， 这 是 表达 随时 间 变 化 的 数字 信号 的 一 
种 方式 ， 称 为 波形 (waveform) 表示 ， 或 称 时 序 图 (timing diagram)。 可 以 将 它 理解 成 画 在 
某 种 绘图 纸 (比如 带 状 记录 纸 ) 上 的 波形 ， 其 中 水 平 轴 代 表 时 间 的 改变 ， 纵 轴 代 表 电 路 中 一 
点 的 逻辑 值 ， 这 个 图 中 表示 的 是 点 B 和 点 C 的 。 


9 假设 我 们 使 用 的 是 较 老 的 5V 逻 辑 系列 ， 而 不 是 较 新 的 3.3V 逻 辑 系 列 。 
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图 2-3 用 门 实现 的 逻辑 与 电路 。 当 输入 A = 1 时 ， 输 出 C 和 输入 B 一 样 ( 门 为 开启 状态 ) ， 
当 输入 A = 0 时 ， 输 出 C = 0， 而 与 输入 B 如 何 变化 无 关 〈 门 为 关闭 状态 ) 


当 A=1 时 ， 与 B 处 输入 相同 的 信号 出 现在 输出 C 上 。B 处 信号 的 改变 并 不 会 立即 导致 C 的 变 
化 ， 因 为 光速 是 有 限 的 ， 电 路 速度 也 不 是 无 限 快 的 。 然 而 ， 以 人 类 日 常生 活 的 尺度 来 看 ， 这 
已 经 是 相当 快 了 。 在 一 个 典型 的 电路 上 ， 如 果 输 入 B 从 0 值 变 到 1 ， 则 经 过 大 约 一 秒 的 十 亿 分 之 
五 (5ns) 的 延迟 ，C 处 即 会 发 生 相 同 的 变化 。 

你 实际 上 以 前 就 见 过 这 种 时 序 图 ， 是 在 医生 检查 你 的 心脏 上 时， 以 心电图 (EKG ， 
electrocardiogram) 的 形式 出 现 的 。 图 上 的 每 个 信号 代表 着 你 心肌 各 个 部 位 的 电压 随时 间 的 变 
化 。 时 间 由 图 上 较 长 的 坐标 轴 表 示 ， 而 每 个 时 间 点 上 的 电压 则 表示 为 墨水 的 纵向 位 移 。 由 于 
典型 的 数字 信号 的 变化 要 比 我 们 从 一 个 带 状 记 录 纸 上 看 到 的 快 得 多 ， 所 以 我 们 就 需要 特殊 的 
设备 〈 比 如 示波器 和 逻辑 分 析 仪 ) 来 记录 这 些 波形 并 以 我 们 能 理解 的 方式 加 以 显示 。 在 接 下 
来 的 章节 中 我 们 还 会 讨论 波形 和 时 序 图 。 

这 样 ， 图 2-3 显 示 出 B 处 的 一 个 输入 波形 。 如 果 我 们 人 可 以 变 得 非常 小 ， 而 且 有 一 个 非常 
快 的 秒表 和 一 个 快速 的 伏特 计 ， 可 以 想像 ， 我 们 坐 在 连接 到 这 个 门 的 B 点 的 线 上 。 当 B 处 电压 
值 发 生变 化 时 ， 我 们 查看 秒表 并 在 图 上 画 出 这 个 时 间 对 应 的 电压 值 ， 那 么 就 能 得 到 图 2-3 所 示 
的 波形 。 

还 要 注意 那 条 表示 从 逻辑 电 平 0 到 逻辑 电 平 1 转换 的 竖 线 ， 它 称 为 上 升 洛 (rising edge) 。 
同样 地 ， 表 示 逻 辑 电 平 1 到 逻辑 电 平 0 转换 的 竖 线 称 为 下 降 洛 (falling edge)。 我 们 通常 希望 上 
升 沿 和 下 降 沿 所 对 应 的 时 间 间 隔 都 很 小 ， 应 该 是 几 个 一 秒 的 十 亿 分 之 一 (ns)。 这 是 因为 在 数 


” 字 系 统 中 ，0 和 1 之 间 的 值 是 未 定义 的 ， 因 此 我 们 希望 信号 能 尽 可 能 快 地 通过 这 个 中 间 地 带 。 


但 这 也 不 是 说 这 些 边 就 对 我 们 毫 无 用 处 ， 恰 恰 相反 ， 它 们 非常 重要 。 事 实 上 ， 当 我 们 在 后 面 
学 习 系 统 时 钟 时 将 会 看 到 这 些 边 的 价值 。 

在 图 2-3 中 ， 如 果 A=1 (图 的 上 半 部 分 )， 那 么 C 处 的 输出 就 会 在 一 个 小 的 时 间 延 迟 后 和 B 
一 样 ( 译 者 注 : 此 处 原文 为 “和 A 一 样 "， 属 笔 误 )。 这 个 延迟 时 间 称 为 传输 延迟 (propagation 
delay) ， 代 表 输 入 信号 上 的 变化 传递 到 元 件 的 输出 所 经 过 的 时 间 。 当 控制 输入 (control input) 
A=0 时 ， 输 出 C 将 总 是 为 0， 而 不 管 输入 B 如 何 变化 。 因 此 ， 输 入 A 对 输入 B 起 到 了 门 控 作用 。 
现在 ， 我 们 将 离开 硬件 设计 的 精彩 世界 中 的 时 序 图 ， 回 到 对 逻辑 门 的 学 习 中 。 

前 面 ， 我 们 提 到 过 与 门 是 三 种 逻辑 门 中 的 一 种 。 我 们 现在 先 把 三 态 门 排除 出 去 ， 在 后 面 
章节 讨论 总 线 组 织 时 再 对 它 进行 深入 学 习 。 以 “原子 ”元 件 或 狼 特 元件 来 论 ， 实 际 上 有 三 种 
逻辑 门 : 与 门 、 或 门 和 非 门 ， 这 些 是 构造 所 有 复杂 数字 逻辑 电路 的 基石 ， 见 图 2-4。 
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c C=A*B 当 A 为 真 且 昌 为 真 时 ，C 为 真 


A 
C C=A+B 。 当 A 为 下 或 B 为 真 时 ，C 为 下 
~ 
A TT B =A 。 当 A 为 假 时 ，B 为 真 


图 2-4 三 个 “原子 ”逻辑 门 ， 与 门 、 或 门 和 非 门 


表示 与 函数 的 符号 和 我 们 在 代数 学 中 用 的 乘法 符号 一 样 。 我 们 后 面 将 看 到 ， 与 操作 类 似 
于 将 两 个 二 进 制 数 相 乘 ， 因 为 1x 1 = 0 并 且 1x0 = 0。 这 个 星 号 是 用 于 将 两 个 变量 做 “与 ” 操 
作 的 方便 符号 。 

表示 或 函数 的 符号 是 加 号 ， 它 在 某 种 程度 上 类 似 于 加 法 ， 因 为 0+0 = 0，1+0 = 1。 对 于 
1+1 则 没有 这 种 类 似 ， 因 为 如 果 是 计算 加 法 则 1 + 1 = 0 (进位 1) ， 但 若是 或 操作 则 1 + 1 = 1。 
好 吧 ， 可 以 把 表示 或 函数 的 符号 看 成 是 对 加 号 的 重 载 。 别 对 我 的 解释 生气 ， 我 仅仅 是 传递 信 
息 的 人 。 

表示 非 的 符号 有 许多 种 形式 ， 主 要 是 由 于 仅 使 用 ASCII 文 字 字 符 无 法 在 一 个 变量 上 面 画 出 
那 条 横 线 。 在 图 2-4 中 ， 我 们 用 变量 A 上 的 横 杠 说 明 输 出 B 是 输入 A 的 非 、 或 者 相反 值 。 如 果 
A = 1， 那 么 B = 0， 如 果 A =0， 那么 B = 1。 如 果 仅 使 用 ASCII 文 本 字符 的 话 ， 那 么 你 可 能 会 
看 到 非 的 符号 是 用 波浪 号 或 者 前 向 斜 线 表 示 的 ， 写 成 B = ~A， 或 B =/A。 非 也 称 为 补 
(complement ) 。 

非 门 的 图 形 表 示 中 ， 也 用 输出 上 的 一 个 小 圆圈 表示 “ 非 ” 的 含义 。 一 个 单 输入 、 单 输出 
的 门 若 没有“ 非 ”的 符号 〈 即 小 圆圈 ) 则 称 为 绥 冲 器 (buffer) 。 缓 冲 器 的 输出 波形 总 是 和 输 
人 波形 一 致 ， 只 是 减 去 一 个 小 的 传输 延迟 。 从 逻辑 上 讲 ， 没 有 明显 的 必要 引入 缓冲 器 门 ， 但 
从 电学 上 看 (又 是 那些 麻烦 的 硬件 工程 师 ! ) 缓冲 器 是 一 种 重要 的 电路 元 件 。 

在 后 面 学 习 模 拟 到 数字 转换 的 课程 时 ， 我 们 还 会 回 到 缓冲 器 的 概念 上 来 。 不 同 于 与 门 和 
或 门 ， 非 门 总 是 只 有 一 个 输入 和 一 个 输出 。 而 且 ， 由 于 它 太 简单 ， 也 没 法 更 简单 地 用 闪光 灯 
电路 显示 非 门 的 效果 ， 因 此 我 们 将 把 重点 放 在 或 门 上 。 

就 像 第 一 次 介绍 与 门 一 样 ， 我 们 也 可 以 用 同样 的 方式 来 看 或 门 。 我 们 将 使 用 来 自 图 1-14 
的 简单 闪光 灯 电 路 ， 但 这 次 将 重新 布置 开关 的 位 置 从 而 产生 逻辑 或 的 功能 。 图 2-5 是 这 个 闪光 
灯 的 电路 。 

图 2-5 所 示 的 电路 中 ， 两 个 开关 A 和 B 并 联 ， 闭 合 其 中 任何 一 个 都 将 允许 电流 从 电视 流 经 开 
关 到 灯泡 再 流 回 来 。 将 两 个 开关 都 闭合 也 不 改变 灯泡 点 亮 的 现状 ， 灯 泡 也 不 会 因此 而 更 亮 。 
让 灯泡 不 亮 的 唯一 办 法 是 将 两 个 开关 都 断 开 从 而 切断 流向 灯泡 的 电流 。 最 后 ， 图 2-5 中 的 小 黑 
点 应 引起 注意 ， 它 表明 两 个 相交 的 导线 确实 有 电 连 接 。 正 如 我 们 前 面 讨论 的 ， 由 于 我 们 的 示 
意图 只 是 二 维 的 ， 而且 印 刷 电 路 板 经 常 有 10 层 互相 绝缘 的 导电 层 ， 所 以 当 看 到 两 个 线 交 又 但 
物理 上 又 没有 连接 时 就 会 造成 混乱 。 通 常 ， 当 两 根 电线 互相 交叉 时 ， 我 们 会 看 到 很 多 放电 火 
花 ， 房 间 也 变 暗 。 在 示意 图 里 ， 我 们 用 一 个 小 黑 点 表示 两 个 线 实 际 连接 在 一 起 ， 任 何其 他 的 
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交叉 线 都 认为 是 相互 绝缘 的 。 


两 个 线 间 的 连接 用 一 黑 点 
表示 








C=AORB 
灯泡 (负载 ) ， 
图 2-5 用 两 个 并 联 开关 实现 的 逻辑 或 功能 。 闭 合 开 关 A、B 中 任何 一 个 都 可 以 点 亮 灯泡 C 


到 现在 为 止 我 们 还 没有 介绍 三 态 逻 辑 门 。 虽然 对 你 来 说 这 种 元 件 存 在 的 原因 还 不 明显 ， 
但 我 们 可 能 还 是 应 该 做 点 介绍 ， 因 此 ， 冒 着 泄露 机 密 的 危险 ， 让 我 们 看 看 图 2-6 中 所 示 的 第 4 
种 “原子 ”逻辑 元 件 : 三 态 逻 辑 门 。 

三 态 门 的 真 值 表 一 


三 态 逻 辑 门 





1 or 0 or Hi-Z 


Output Enable 


图 2-6 三 态 (TS) 逻辑 门 。 当 输出 使 能 端 (OE) 为 低 电压 时 门 的 输出 跟随 输入 变化 。 
当 OE 为 高 电压 时 门 的 输出 端 为 高 阻 状 态 


关于 三 态 门 有 几 个 重要 的 概念 ， 因 此 我 们 要 花 一 些 时 间 来 解释 这 幅 图 。 首 先 ， 左 边 表示 
门 的 电路 图 几乎 和 非 门 一 样 ， 只 是 在 输出 端 没有 表示 “ 非 ”的 小 国 图 ， 说 明 输出 在 某 个 传输 
延迟 之 后 跟随 输入 的 逻辑 状态 ， 这 使 得 这 个 门 也 称 为 缓冲 器 门 (buffer gate) 。 然 而 ， 这 些 并 
不 说 明 我 们 不 能 通过 用 一 个 非 门 来 得 到 三 态 门 ， 但 那样 三 态 门 就 不 是 “原子 ”器 件 了 ， 那 将 
是 一 个 复合 门 (compound gate ) 。 

三 态 门 还 有 第 二 个 输入 ， 在 图 中 用 Output Enable (输出 使 能 ) 标记 。 这 个 输入 端 上 有 一 
个 表示 “ 非 ” 的 小 圆圈 ， 这 说 明 三 态 门 是 “ 低 电 平 有 效 ”(active low) 的 ， 这 里 我 们 引入 了 
一 个 新 的 术语 ， 那 么 什么 叫 “ 低 电 平 有 效 ” 呢 ?前 面 一 章 中 ， 我 们 快速 地 提 到 过 逻辑 电 平 有 
任意 性 。 为 了 方便 ， 我 们 常 令 较 高 的 电压 为 1 (或 真 ) ， 而 令 较 低 的 电压 为 0 (或 假 ) 。 这 就 是 
通常 使 用 的 正 运 辑 。 使 用 正 逻 辑 其 实 没有 什么 特别 的 道理 ， 只 是 一 种 广泛 使 用 的 习惯 而 已 。 

然而 也 有 某 些 时 候 ， 我 们 希望 让 逻辑 状态 “ 真 ”代表 一 个 低 电压 (或 0)。 其 实 这 又 涉及 
一 个 更 基本 的 问题 ， 即 便 我 们 在 处 理 一 个 逻辑 状态 ， 这 个 信号 的 意义 也 并 不 十 分 清晰 。 可 以 
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举 出 很 多 种 情况 ， 其 中 信号 被 当 作 一 个 起 控制 或 使 能 作用 的 设备 。 在 这 些 情况 下 ， 真 和 假 的 
含意 就 和 它们 在 一 个 复杂 的 逻辑 方程 中 的 不 那么 一 样 了 。 这 就 是 我 们 面 对 三 态 门 缓冲 器 时 过 
到 的 情况 。 . 

当 Output Enable (简写 为 OE ) 上 的 信号 为 低 电 压 时 ， 它 对 三 态 门 缓冲 器 是 有 效 的 。 在 
这 个 例子 里 ， 当 OE 输入 为 低 电 压 时 ， 缓 冲 器 有 效 ， 输 出 状态 跟随 输入 信号 变化 。 现 在 ， 你 
可 能 马上 会 说 :“ 别 骗 人 了 ， 那 其 实 是 一 个 与 门 ， 不 是 吗 ? ”确实 ， 你 差 一 点 就 说 对 了 。 在 图 
2-3 中 ， 我 们 通过 与 门 介绍 了 与 逻辑 功能 。 当 A 输入 为 0 时 ， 门 的 输出 也 是 0， 而 与 B 输 入 的 软 
辑 状态 无 关 。 三 态 门 则 与 这 个 有 实质 的 区 别 。 当 OE 端 为 高 电压 时 ， 从 电路 角度 来 看 这 个 门 ， 
门 的 输出 就 不 存在 了 ， 就 好 像 门 不 在 那儿 ， 这 就 是 高 阻抗 状态 。 因 此 ， 图 2-6 中 所 表现 的 情形 
是 不 同 于 其 他 的 ， 当 OE 为 低 电压 时 三 态 门 就 像 一 个 闭合 的 开关 ， 而 当 OE 为 高 电压 时 它 就 像 
一 个 断 开 的 开关 。 换 句 话说 ， 高 阻 既 不 是 逻辑 状态 1、 也 不 是 逻辑 状态 0， 而 是 一 种 独一无二 
的 状态 ， 它 和 数字 逻辑 关系 不 大 ， 但 在 建造 计算 机 的 实际 电路 中 却 缺 少不了 它 。 在 后 面 的 章 
节 中 我 们 还 会 继续 讨论 三 态 门 缓冲 器 ， 准 备 好 继续 学 习 1 

图 2-6 中 还 有 最 后 一 个 新 概念 要 介绍 。 注 意图 中 右上 和 角 的 真 值 表 。 真 值 表 是 描述 一 个 逻辑 
系统 所 有 可 能 状态 的 简洁 方式 。 在 这 里 ， 三 态 缓冲 器 的 输入 端 有 两 种 逻辑 状态 ， 而 OE 控制 
端 也 有 两 种 状态 ， 所 以 对 这 个 门 来 说 一 共有 4 种 可 能 的 组 合 。 当 OE 为 低 电 压 时 输出 端 与 输入 
端 相同 ， 当 OE 为 高 电压 时 输出 端 为 高 阻抗 状态 ， 并 使 得 输入 不 可 见 。 因 此 ， 我 们 把 这 个 器 
件 所 有 可 能 的 工作 状态 都 用 一 个 整齐 的 小 表格 描述 出 来 了 。 

现在 在 我 们 的 词汇 里 有 了 4 种 逻辑 元 件 : 与 门 、 或 门 、 非 门 和 三 态 门 。 就 像 用 DNA 构 成 不 
同 的 生命 一 样 ， 这 些 也 是 数字 系统 的 基本 元 件 。 事 实 上 ， 前 面 三 种 门 经 常 被 组 合成 一 些 稍微 
有 点 不 同 的 门 :“ 与 非 门 ”(NAND)、“ 或 非 门 ”(NOR) 和 “ 异 或 门 ”(XOR)。 这 三 种 新 的 
门 被 称 为 复合 门 ， 因 为 它们 是 由 与 门 、 或 门 和 非 门 组 合 而 成 的 。 从 电学 上 讲 ， 由 组 合 元 件 构 
成 的 电路 和 由 基本 元 件 构 成 的 电路 一 样 快 ， 因 为 组 合 函 数 可 以 方便 地 用 它们 实现 。 我 们 只 是 
从 逻辑 的 角度 对 它们 加 以 区 别 。 

图 2-7 所 示 为 两 个 复合 门 : 与 非 门 和 或 非 门 。 与 非 门 由 一 个 与 门 后 接 一 个 非 门 构成 。 与 非 
门 的 逻辑 功能 可 以 表述 为 : 

。 当 且 仅 当 输 入 A 为 高 电压 且 输 入 B 为 高 电压 时 ， 输 出 C 为 低 电压 。 
或 非 门 的 逻辑 功能 可 以 表述 为 : 

。 当 输入 A 为 高 电压 、 输 入 B 为 高 电压 、 或 两 者 都 为 高 电压 时 ， 输 出 C 为 低 电 压 。 


A A 
, NAND 下 c 
, AND [> cS 


C=A*B 当 A 为 真 且 B 为 真 时 ，C 为 假 ”- 


mE > 


C=A+B 当 A 为 真 或 B 为 真 时 ，C 为 假 
图 2-7 与 非 门 和 或 非 门 的 示意 图 ， 它 们 分 别 为 与 门 和 非 门 的 组 合 、 或 门 和 非 门 的 组 合 
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最 后 ， 我 们 再 学 习 一 个 复合 门 结构 ， 即 异 或 门 。 异 或 门 (exclusive OR gate) 的 英文 速记 
符号 为 XOR (发 音 为 “ex or”)。 异 或 门 和 或 门 差不多 ， 除 了 当 输 入 A 和 B 都 为 1 时 它 的 输出 C 
为 0， 而 不 是 1。 

图 2-8 显 示 了 异 或 复合 门 的 电路 图 ， 它 比 我 们 在 前 面 看 到 的 任何 门 电路 都 要 复杂 ， 所 以 我 
们 要 花 一 些 时 间 加 以 介绍 。 异 或 门 有 两 个 输入 端 (A 和 B) 和 一 个 输出 端 (C)。 输 入 A 直接 连 
接 到 了 与 门 3 的 输入 ， 也 连接 到 了 非 门 1 的 输入 并 被 求 磋 。 类 似 地 ， 输 入 B 连 接 到 了 与 门 4 的 输 
入 ， 而 它 的 补 〈 非 ) 则 连接 到 了 与 门 3 的 输入 。 因 此 ， 每 个 与 门 的 输入 都 是 变量 A 和 B 中 的 一 
个 ， 以 及 另外 一 个 变量 的 补 ， 即 人 A 或 互 。 这 里 播 一 句 话 ， 现 在 你 应 该 感谢 示意 图 中 黑 点 的 用 
处 ， 没 有 它 我 们 就 无 法 区 分 相互 连接 的 线 和 那些 仅仅 是 相互 交叉 的 线 了 。 


:只 


C=A@B 






,一 一 本 
B 
-全 物理 连接 
当 A 为 真 或 B 为 真 ， 但 它们 又 不 同时 为 真 时 ，C 为 真 
图 2-8 一 个 异 或 门 (XOR) 的 电路 示意 图 


因此 ， 与 门 3 的 输出 可 以 表示 为 逻辑 表达 式 A* B ， 类 似 地 ， 与 门 4 的 输出 为 B*A 。 最 后 ， 
用 或 门 5 来 组 合 这 两 个 表达 式 ， 从 而 可 以 把 输出 变量 C 表 示 为 关于 两 个 输入 变量 A 和 B 的 函数 : 
C = A* B + B*A 。 这 种 复合 异 或 门 的 图 形 符号 如 图 2-8 所 示 ， 它 和 或 门 很 像 ， 只 是 在 或 门 的 
输入 上 加 了 一 条 线 。 异 或 的 运算 符号 为 一 个 外 面 带 一 个 圆圈 的 加 号 。 

让 我 们 对 这 个 电路 进行 仔细 的 考察 ， 以 验证 它 确实 如 我 们 所 想 的 那样 工作 。 假 设 A 和 B 都 
是 0， 这 意味 着 这 两 个 与 门 都 有 一 个 值 为 0 的 输入 ， 因 此 它们 的 输出 必然 也 为 0。 第 5 个 门 即 或 
门 的 输入 均 为 0， 因 此 它 的 输出 也 为 0。 如 果 A 和 B 均 为 1， 那 么 两 个 非 门 (第 1 个 门 和 第 2 个 门 ) 
对 这 个 值 求 非 就 为 0， 这 时 的 情形 与 前 面 一 样 ， 每 个 与 门 都 有 一 个 值 为 0 的 输入 。 

在 第 三 种 情况 中 ，A 为 0，B 为 1， 或 者 颠倒 过 来 。 无 论 是 哪 种 情况 ， 都 有 一 个 与 门 其 两 个 
输入 均 为 1， 因 此 它 的 输出 也 为 1。 这 说 明 至 少 有 一 个 或 门 的 输入 将 为 1， 所 以 或 门 的 输出 也 为 1。 
另 一 种 表述 异 或 门 的 方式 是 ， 当 输入 A 为 真 或 输入 B 为 真 ， 但 它们 又 不 同时 为 真 时 输出 为 真 。 

你 可 能 会 问 自己 ,“ 这 些 都 有 什么 用 ? ”很 快 你 就 会 看 到 ， 异 或 门 可 用 于 构造 计算 机 的 一 - 
个 重要 电路 元 件 一 一 加 法 电路 。 为 了 理解 这 一 点 ， 我 们 假设 要 对 两 个 一 位 的 二 进 制 数 求 和 。 
设 这 两 个 数 为 A 和 B， 它 们 和 的 取 值 有 下 面 的 几 种 可 能 性 : 

。A=0HB=0:A+B=0 

*。A=1lBB=0:A+B=1 

。A=0HB=1:A+B=1 

。A=1HB=1:A+B=0， 进 位 1 
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数 季 还 帮 知人 旬 
只 要 我 们 能 想 办 法 处 理 好 带 进位 的 情况 ， 这 些 条 件 看 起 来 就 非常 像 求 A XOR B 。 
另外 ， 请 注意 图 2-8， 其 中 给 出 了 表示 异 或 门 的 输出 C 的 一 个 逻辑 方程 式 ， 即 
C=A+*B+ B*A 
这 是 我 们 称 异 或 门 为 复合 门 的 另 一 个 原因 ， 它 可 以 用 我 们 前 面 讨论 过 的 多 个 “原子 ” 门 的 逻 
辑 表 达 式 加 以 表示 。 

现在 假设 我 们 对 异 或 门 做 少许 修改 ， 在 它 的 输出 端 加 上 一 个 非 门 。 从 效果 上 看 ， 我 们 得 
到 了 一 个 “ 同 或 门 ”(XNOR) 。 对 于 这 种 门 ， 当 两 个 输入 相同 时 其 输出 为 1， 当 两 个 输入 不 同 
时 其 输出 为 0。 因 此 ， 我 们 就 构造 出 了 一 个 可 以 检查 信号 相同 性 的 电路 元 件 。 利用 32 个 同 或 门 ， 
(经 过 适当 的 传输 延迟 ) 我 们 可 以 马上 知道 两 个 32 位 数 是 否 相等 。 

就 像 我 们 可 以 用 32 个 同 或 门 来 比较 两 个 32 位 数 一 样 ， 下 面 看 看 如 果 我 们 对 两 个 32 位 数 做 
逻辑 与 操作 又 会 怎样 。 从 其 他 的 编程 课 上 你 已 经 知道 可 以 对 两 个 变量 做 逻辑 与 运算 ， 其 得 到 
的 结果 为 布尔 真 (TRUE) 或 假 (FALSE)。 但 这 样 对 两 个 32 位 数 做 与 运算 到 底 是 什么 意思 
呢 ? 在 这 种 情况 下 ， 与 操作 也 被 称 为 “ 按 位 与 ”(bitwise AND)， 因为 它 对 两 个 数 中 每 个 对 应 
的 位 做 与 运算 。 下 面 将 参考 图 2-9 加 以 说 明 。 为 了 简单 起 见 ， 我 们 给 出 了 两 个 8 位 数 的 按 位 与 
运算 ， 而 不 是 32 位 数 的 按 位 与 运算 ， 所 带 来 的 差别 仅仅 是 所 使 用 的 与 门 数 目的 不 同 。 


OxAA Ox55 Ox00 
0 AND 0 


一 


之 
DD 


0 


0 
0 
Or 
0 


0 AND 
1 


OO 
bp 
2 
口 


:OxAA AND:0x55 = 0x00 





图 2-9 两 个 8 位 ( 字 节 ) 二 进 制 值 的 按 位 与 运算 。 称 其 为 按 为 与 运算 的 原因 是 它 对 两 个 数 的 对 应 位 
进行 操作 。 在 C 和 C++ 语言 中 ， 十 六 进 制 数 以 前 缀 0x 开 始 


在 图 2-9 中 ， 我 们 对 两 个 单字 节 长 度 的 值 0xAA 和 0x55 做 了 按 位 与 运算 。 因为 每 个 与 门 都 
有 一 个 输入 为 1， 而 另 一 个 输入 为 0%， 所 以 它们 的 输出 都 为 0。 在 C/C++ 语言 中 ， 符号 & 表 示 按 
位 与 操作 ， 因 此 我 们 可 以 写 出 下 面 的 程序 片段 : 

程序 代码 示例 

char inA = OxAA; 

char inB = 0x55; 

char OutC = inA & inB; 


Cout << “The bitwise ANDing of 0x55 and OxAA = :" OutC << endl; 
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如 果 我 们 真 的 写 一 个 程序 并 运行 它 ， 那 么 得 到 的 结果 一 定 是 0。 作 为 对 68 000 汇 编 语言 包 
预习 ， 同 样 的 方程 用 汇编 语言 可 以 写成 ; 
程序 代码 示例 


MOVE .B #$AA, DO 
ANDI.B  #$55,D0 


第 一 条 汇编 指令 将 字 节 0xAA 找 贝 到 了 一 个 内 部 寄存 器 D0， 第 二 条 指令 对 0x55 和 D0 中 的 
内 容 〈 即 0xAA) 做 了 按 位 与 操作 。“ANDI.B” 解 释 为 ,“ 对 寄存 器 D0 的 字 节 值 部 分 和 立即 
(文字 ) 值 $55 做 逻辑 与 运算 " 。 我 们 也 可 以 写成 “ANDI.W” 或 “ANDIIL” 来 指定 其 分 别 进行 
16 位 操作 或 32 位 操作 。 结 果 0 现 在 存储 于 寄存 器 D0 中 。 如 果 现 在 这 对 你 没有 任何 意义 ， 那 么 
不 要 着 急 ， 它 可 能 以 后 对 你 也 没有 任何 意义 (但 也 可 能 会 有 意义 的 )。 

到 现在 为 止 ， 我 们 介绍 的 与 门 、 或 门 ， 以 及 它们 派生 出 来 的 门 都 只 有 两 个 输入 端 和 一 个 
输出 端 。 其 实 与 门 和 或 门 可 以 有 任意 多 个 输入 ， 为 了 说 明 这 一 点 ， 让 我 们 看 图 2-10。 





情形 1 8 C = f(A,B.G,D) 


C 


局 0 


C = f(A,B,G,D) 
F(A,B,G,D) C 


情形 2 


已 外 男 > 


图 2-10 多 于 两 个 输入 端的 与 门 的 逻辑 等 价 电路 。 虽 然 情形 1 和 情形 2 逻辑 功能 完全 相同 ， 
但 是 如 果 考 虑 逻辑 速度 〈 传 输 延 迟 ) ， 它 们 就 不 一 样 了 


情形 1 所 示 为 将 三 个 具有 两 个 输入 端的 与 门 连接 起 来 ， 使 得 当 且 仅 当 A、B、G 和 D 都 为 真 
时 输出 C 为 真 。 情 形 2 中 的 电路 看 上 去 更 为 简单 。 事 实 上 ， 我 们 可 以 设计 出 一 个 与 情形 1 中 一 个 
门 基 本 相同 的 电子 电路 对 应 于 情形 2， 它 们 的 唯一 差别 在 于 进行 与 操作 的 输入 端的 数目 。 然 而 ， 
如 果 假设 图 2-10 中 所 有 门 的 传输 延迟 都 一 样 ， 那 么 情形 2 中 4 个 输入 门 的 传输 延迟 将 仅 是 情形 1 
中 的 /3 左右 。 上 述 分 析 同 样 适用 于 或 门 。 但 是 ， 它 不 适用 于 异 或 门 ， 因 为 异 或 运算 的 数学 函 
数 决定 了 它 一 次 仅 能 处 理 两 个 输入 变量 。 


2.2 电子 门 描述 


现在 ， 大 多 数 的 门 电路 都 是 由 集成 电路 (IC) 做 成 的 电子 器 件 。 你 可 能 想 知道 这 种 门 电 
路 的 内 部 是 怎样 的 。 这 是 个 很 自然 的 问题 。 尽 管 可 能 是 一 种 有 趣 的 尝试 ， 但 讲授 晶体 管理 论 
或 集成 电路 设计 并 不 是 本 书 的 目的 。 我 们 让 电子 工程 师 保留 一 些 秘密 ， 毕 竞 ， 你 已 经 看 到 他 
们 写 的 程序 是 多 么 的 混乱 。 下 面 我 们 迅速 地 次 一 眼 这 样 的 集成 电路 。 图 2-11 是 一 个 工业 标准 部 
件 74LS00 的 图 片 。 这 里 数字 “74” 指 明了 部 件 的 逻辑 系列 ， 以 及 它们 可 以 正常 工作 的 温度 范 
围 。“74” 系 列 部 件 是 为 商业 用 途 设 计 的 ， 而 “54” 系 列 则 用 于 军事 用 途 ， 并 且 可 以 在 一 个 比 
较 宽 的 温度 范围 内 使 用 。 字 母 “LS” 是 “ 低 功 耗 肖 特 基 ” (low-power Schottky) 的 缩写 ， 它 
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是 几 种 标准 集成 电路 制造 工艺 之 一 。 最 后 一 个 标示 “00” 表 示 集 成 电路 的 封装 类 型 ， 这 种 封 
装 包含 4 个 与 非 门 ， 其 中 每 个 包含 两 个 输入 和 一 个 输出 。 整 个 部 件 放 在 一 个 带 14 个 引 脚 (每 边 
7 个 ) 的 塑料 封装 中 。 这 被 到 ov 
称 为 DIP 封 装 ， 为 “ 双 列 直 地 ) 
插 塑 料 ”(dual-inline plastic ) 
的 缩写 。 由 于 显而易见 的 原 
因 ， 像 这 样 的 集成 电路 部 件 
也 被 称 为 “臭虫 ”(bug) 。 

图 2-11 所 示 的 集成 电路 
(IC) 包含 了 4 个 独立 的 与 非 
门 。 每 个 门 有 两 个 输入 端 和 


构 需 要 为 这 些 门 准备 12 个 输 图 2-11 4 个 双 输 入 与 非 门 〈 工 业 标 准 设计 74LS00)。 塑 料 封装 中 包含 4 个 


入 /输出 (WO) 引 脚 ， 另 外 独立 的 与 非 门 。 集 成 电路 被 一 个 塑料 封装 包 庄 起 来 (显示 在 右 
还 有 一 个 引 脚 接 电源 和 一 个 边 ) 。 门 A 的 输入 引 脚 为 1 和 2， 输 出 引 脚 为 3 


引 脚 接地 。 对 应 LS 逻辑 部 件 系 列 ， 电 源 为 +3SV。 大 约 花 10 美 分 就 可 以 买 到 一 个 这 样 的 封装 ， 
而且 其 中 任何 一 个 门 从 输入 改变 到 输出 响应 的 传输 延迟 大 约 都 是 Sns。 

我 们 仍然 没有 回答 那个 关于 门 的 内 部 构造 的 问题 。 我 曾 说 过 晶体 管 能 起 到 很 好 的 开关 作 
用 ， 而 开关 电路 又 可 以 构造 出 很 好 的 逻辑 电路 ， 因 此 我 们 现在 看 看 它 是 怎么 工作 的 。 与 其 讨 
论 以 较 老 的 工艺 制造 的 LS 逻辑 电路 系列 ， 不 如 分 析 一 种 称 为 CMOS 的 更 现代 的 工艺 。CMOS 
的 发 音 为 “sea moss”， 它 是 互补 型 金属 和 氧化 物 硅 (complementary metal-oxide silicon) 的 缩 
写 。CMOS 是 当今 主流 的 集成 电路 工艺 ， 并 且 到 可 以 预见 的 未 来 它 一 直 都 会 被 使 用 。 几 乎 所 
有 的 现代 微 处 理 器 都 是 用 CMOS 工 艺 制造 的 。 此 外 ， 你 也 可 能 在 有 关 数 码 相 机 的 图 像 传感器 
的 场合 听 到 过 这 个 术语 。 由 于 这 是 一 个 非常 重要 的 工艺 ， 所 以 我 们 应 该 花 一 些 时 间 来 理解 它 ， 
哪怕 是 粗略 地 。 

为 了 理解 基本 的 CMOS 构 造 ， 让 
我 们 回 到 我 们 所 了 解 的 机 械 开 关上 
来 ， 请 看 图 2-12。 

请 不 要 太 在 意 这 幅 图 的 绘图 质 
量 ， 即 便 只 是 用 线段 画 出 来 的 ， 也 足 
以 说 明 电 路 的 工作 过 程 了。 想像 在 逻 
辑 电 平和 逻辑 电 平 0 之 间 有 两 个 串联 
(相继 ) 的 机 械 开关 。 在 实际 电路 中 ， 
逻辑 1 应 该 是 电源 ， 而 逻辑 0 应 该 是 电 
路 的 接地 点 (0V)。 现 在 ， 很 明显 你 
不 能 在 同一 时 间 同 时 闭合 两 个 开关 ， 
否则 会 产生 不 良 后 果 。 这 就 类 似 于 我 
在 5 岁 时 拉 直 了 一 个 回形针 ， 想 看 看 逻辑 电 平 0 逻辑 电 平 0 
如 果 把 它 插 到 墙 上 的 电灯 插座 里 会 怎 要 
么 样 。 虽 然 我 的 经 历 更 加 让 人 印象 深 ET 
刻 ， 也 许 比 图 2-12 提 供 了 更 深刻 的 学 习 经 历 ， 但 在 概念 上 有 相同 的 结果 。 





逻辑 电 平 1 逻辑 电 平 1 





40 
41 


34 第 2 便 

为 了 输出 一 个 逻辑 电 平 0， 我 们 可 以 闭合 连接 到 逻辑 0 的 开关 ， 断 开 连 接 到 逻辑 1 的 开关 。 
此 时 电路 输出 端的 观察 者 将 会 看 到 逻辑 0， 因为 开关 将 它 连接 到 了 那个 逻辑 电 平 。 另 一 种 情况 
给 了 我 们 输出 逻辑 1 的 条 件 ， 即 当 闭合 上 面 的 开关 而 断 开 下 面 的 开关 时 ， 我 们 会 “看 到 ”逻辑 
电 平 1。 

现在 ， 你 应 该 已 经 弄 清 楚 了 一 个 重要 的 事实 。 当 我 们 第 一 次 讨论 逻辑 信号 的 上 升 沿 概念 
和 下 降 沿 概念 时 ， 我 说 过 这 些 沿 必 须 是 两 个 逻辑 状态 之 间 非 常 快速 的 转换 。 图 2-12 说 明了 为 
什么 是 这 样 。 我 们 不 希望 出 现 两 个 开关 同时 闭合 的 情况 ， 因 此 ， 如 果 逻 辑 转 换 过 程控 制 着 这 
些 开 关 的 开启 或 闭合 ， 那么 一 个 开关 的 开启 过 程 和 另 一 个 开关 的 闭合 过 程 之 间 的 任何 重合 都 
应 尽量 的 短暂 。 

图 2-13 是 一 个 CMOS 逻 辑 门 的 实际 电路 结构 ， 它 是 电源 (Vcc) 

一 个 非 门 。 首 先 要 说 的 是 ， 我 是 带 着 巨大 的 怕 恐 给 大 
家 展示 这 幅 图 的 。 原 因 之 一 是 ， 我 考虑 到 我 正在 透露 
过 多 的 神圣 而 机 密 的 信息 ， 电 子 工程 专业 的 兄弟 姐妹 
们 将 会 要 求 我 予以 补偿 。 另 外 ， 我 不 能 肯定 在 计算 机 
系统 结构 这 个 更 大 的 专业 范围 内 这 是 否 是 一 个 必须 知 
道 的 内 容 。 无 论 如 何 ， 让 我 们 继续 下 去 ， 你 可 以 自己 
来 判断 。 灰 色 圆 圈 内 的 符号 所 表示 的 两 个 电路 设备 被 
称 为 MOSFET， 它 是 金属 氧化 物 硅 场 效应 晶体 管 
(Metal Oxide Silicon Field-Effect Transistor) 的 缩写 。 
MOSFET 有 两 种 常用 的 类 型 : n 型 或 n 沟 道 型 ，p 型 或 p 
沟 道 型 。n 沟 道 型 器 件 符号 中 有 一 个 指向 器 件 内 部 的 箭 国生 生机 

头 ， 而 p 沟 道 型 器 件 符号 中 的 箭头 则 指向 外 面 。 n 型 晶体 管 和 p 型 晶体 管 的 区 别 在 于 它们 的 制造 
工艺 ， 具 体 的 说 ,就 是 为 使 晶体 管 赋予 所 需 电学 特性 而 加 入 硅 中 的 杂质 的 类 型 。 

CMOS 器 件 中 的 MOSFET 晶 体 管 是 成 对 使 用 的 ， 一 个 n 型 管 和 一 个 p 型 管 在 一 起 构成 一 对 。 
除了 前 面 说 的 制造 工艺 上 的 区 别 ， 这 两 种 器 件 的 主要 区 别 是 n 沟 道 器 件 用 于 正 电 压 情 况 下 ， 而 
p 沟 道 器 件 用 于 负电 压 情况 下 。 如 果 你 还 不 能 理解 它 的 意思 ， 那么 请 继续 往 下 看 ， 我 肯定 下 面 
会 说 得 更 清楚 。 总 之 ， 除 了 一 个 是 正 电 压 器 件 ， 另 一 个 是 负电 压 器 件 外 ， 两 种 晶体 管 的 功能 
几乎 完全 一 样 ， 因 此 习惯 上 也 将 它们 称 为 互补 型 (complementary) 。 因 此 ， 将 特征 相似 的 一 个 
n 型 MOSFET 和 一 个 p 型 MOSFET 放 在 一 起 ， 就 形成 了 一 个 互补 对 ， 即 一 个 CMOS 门 。 

每 个 器 件 都 有 三 个 不 可 或 缺 的 端口 (或 极 ) ， 标 有 字母 “G” 的 是 栅 极 (gate)， 标 有 字母 
“D” 的 是 涡 极 (drain)， 而 字母 “S” 旁 的 端口 称 为 源 极 (source)。 有 时 还 要 考虑 第 4 个 端口 ， 
那 就 是 衬 底 (substrate) ， 也 称 体 极 (body) ， 用 字母 “B” 表 示 。 有 时 候 会 将 这 个 端口 引出 来 
作为 一 个 独立 控制 端 ， 但 在 我 们 的 电路 结构 中 它 连接 到 了 源 极 上 ， 因此 不 需要 考虑 。 为 了 了 
解 CMOS 门 是 怎么 工作 的 ， 我 们 应 该 快速 地 看 看 一 个 MOSFET 器 件 的 简单 行为 图 。 图 2-14 大 致 
给 出 了 一 个 MOSFET 器 件 的 漏 极 到 源 极 电阻 (Rps) 随 栅 极 和 源 极 间 电 压 Ves 的 变化 关系 。 因 
为 我 们 现在 还 没有 真正 给 出 电阻 的 定义 ， 所 以 我 也 不 期 望 上 述 介 绍 有 多 大 效果 ， 但 从 概念 上 
讲 电阻 与 我 们 前 面 讨论 三 态 门 时 用 到 的 电学 阻抗 是 完全 一 样 的 。 

考察 图 2-14 中 m 沟 道 器 件 的 曲线 ， 我 们 看 到 当 栅 极 和 源 极 之 间 的 电压 增 大 时 ， 器 件 的 电阻 
值 会 从 几 千 万 欧姆 (ohm) 迅速 下 降 到 10 欧 姆 左右 。 实 际 上 ， 能 够 导致 这 种 剧烈 变化 的 栅 极 
电压 变化 范围 就 恰好 是 从 逻辑 0 到 逻辑 1 的 电压 摆动 。 考虑 图 2-12 所 示 的 电路 功能 的 类 比 ， 升 
高 顶 极 电压 就 相当 于 闭合 开关 。 可 见 ， 当 栅 极 电压 比 源 极 电压 小 得 更 多 时 ， p 沟 道 器 件 会 发 生 





数字 逻 帮 让 介 35 





与 上 面 所 说 的 类 似 的 情况 。 换 名 话说， 它 会 显示 出 互补 的 行为 。 现 在 ， 我 们 把 这 些 东西 放 在 
一 起 ， 就 可 以 理解 CMOS 门 的 普遍 规 
律 和 图 2-13 中 的 特殊 形式 了 。 

再 回 到 图 2-13 ， 记 得 它 是 一 个 非 
门 ， 我 们 来 看 看 为 什么 它 是 一 个 非 门 。 
假设 栅 极 电压 是 逻辑 9，n 型 晶体 管 必 
然 是 断 开 的 开关 ， 因 为 电阻 特别 大 
(因为 Ves 几 乎 是 0) 。 然 而 ， 由 于 栅 极 
电压 比 源 极 电 压 小 得 多 (一 Vos 非 常 大 )， 
所 以 互补 器 件 p 型 晶体 管 的 电阻 就 特别 





小 ， 这 就 形成 了 图 2-12 中 的 闭合 开关 。 人 
ee he eh 图 2-14 n 沟 道 和 p 沟 道 MOSFET 器 件 的 电学 特性 。 用 对 数 内 
标 将 器 件 的 电阻 值 绘制 成 一 个 关于 器 件 棚 极 电压 的 


1, 一 个 高 电阻 ( 断 开 的 开关 ) 连 着 
逻辑 9， 门 的 输出 是 逻辑 1。 因 此 ， 当 
门 的 输入 为 逻辑 0 时 ， 其 输出 为 逻辑 1。 你 应 该 能 够 像 上 面 那样 分 析 互补 的 另 一 种 情况 ， 即 输 
入 为 逻辑 1 的 情况 。 因 此 我 们 可 以 把 CMOS 非 门 的 行为 总 结 成 : 当 输 入 为 逻辑 0 时 ， 输 出 为 电 
源 电压 ， 即 逻辑 1， 当 输入 为 逻辑 1 时 ， 输 出 为 接地 电压 ， 即 逻辑 0。 
图 2-14 展 示 了 MOS 唱 体 管 的 电学 特性 。 考 察 图 右边 的 N 沟 道 器 件 ， 当 栅 极 相对 于 源 极 的 电 
压 Vos 增 大 (或 者 说 向 正方 向 变化 ) 时 ， 漏 极 和 源 极 间 的 电阻 呈 指 数 级 下 降 。 相 反 ， 当 Vos 趋 
向 于 0 (或 者 说 向 负 方 向 变化 ) 时 ， 漏 极 和 源 极 间 的 电阻 趋向 于 无 穷 大 。 基 本 上 ， 当 Ves 为 0 或 
者 负数 时 ， 我 们 就 有 一 个 断 开 的 开关 ， 而 当 Ves 为 几 伏特 电压 时 ， 我 们 就 有 一 个 几乎 是 闭合 的 
开关 。 了 P 沟 道 器 件 的 行为 和 N 沟 道 的 一 样 ， 除 了 电压 的 正 负极 是 反 过 来 的 。 
在 我 们 离开 CMOS 门 的 电学 行为 这 一 话题 之 前 ， 你 可 能 会 问 自己 :“ 当 栅 极 相对 于 源 极 的 
电压 不 是 逻辑 1 或 0， 而 在 两 者 之 间 ， 会 发 生 什 么 情况 呢 ? ” 换 句 话说 ， 当 栅 极 的 逻辑 输 估 的 
上 升 沿 或 下 降 沿 处 在 两 个 逻辑 状态 间 进行 转换 时 会 怎样 ? 根据 图 2-14 中 的 曲线 ， 如 果 电 阻 非 
常 高 ， 或 者 不 是 很 低 ， 就 像 《 金 发 女孩 和 三 只 能 》 中 的 粥 的 温度 ( 译 者 注 : 童话 故事 ， 指 粥 
既 不 次 也 不 凉 )。 在 这 种 情况 下 ,就 形成 了 一 条 从 电源 到 地 的 电流 通路 ， 因 此 会 浪费 一 些 电能 。 
幸运 的 是 ， 状 态 间 的 转换 过 程 很 快 ， 虽 然 了 
确实 还 是 有 一 些 能 量 损耗 。 攻 y 各 种 AMD 内 核 的 热 功 耗 
这 种 情况 会 带 来 多 坏 的 影响 呢 ? 别 忘 
了 现代 的 微 处 理 器 中 有 千 万 量 级 的 CMOS 
门 ， 而 这 些 门 的 大 部 分 都 以 每 秒 十 亿 次 或 
更 快 的 速度 切换 逻辑 状态 。 图 2-15 应 该 能 
给 你 一 些 关 于 能 量 损耗 的 直观 印象 。 
注意 两 件 事情 。 首 先 ， 这 些 现代 微 处 
理 器 确实 都 发 热 。 事 实 上 ， 它 们 散发 的 能 
量 相当 于 一 个 普通 的 60~75 瓦 的 电灯 泡 。 4 
此 外 ， 对 每 个 系列 的 处 理 器 ， 当 提高 时 钟 内 核 时 钟 频率 (MHz) 
频率 使 它 运行 更 快 时 ， 我 们 可 以 看 到 功 耗 ”图 2-15 各 种 系列 AMD 处 理 器 的 能 量 损耗 随时 钟 速率 
也 随 之 变 大 。 的 变化 曲线 。 来 自 www.tomshardware.com3 
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你 也 可 能 会 问 另 一 个 问题 :“ 假 设 我 们 让 时 钟 频率 变 小 ， 直 至 让 它 相 当 小 ， 甚 至 停 下 来 ， 
会 产生 相反 的 效果 吗 ? ”很 明显 ， 通 过 减 慢 时 钟 速度 或 者 关 掉 芯片 的 部 分 电路 ， 我 们 可 以 相 
应 地 减少 芯片 的 功率 需求 。 这 是 用 在 笔记 本 电脑 上 的 一 个 重要 策略 ， 它 使 得 电池 能 支持 电脑 
在 从 纽约 到 洛杉矶 的 飞机 上 持续 工作 。 这 也 是 许多 用 于 其 他 嵌入 式 应 用 的 微 处 理 器 的 策略 ， 
这 样 的 微 处 理 器 能 系 在 环线 驼 鹿 颈 脖 的 项 圈子 上 以 跟踪 它 两 年 时 间 多 的 迁徙 过 程 ， 而 其 所 用 
的 能 量 还 不 超过 一 节 AAA 电 池 。 不 要 惊奇 CMOS 是 这 么 的 普及 ! 

好 了 ， 我 们 已 经 看 了 一 个 非 门 的 结构 。 那 是 一 种 非常 简单 的 门 ， 其 他 稍微 复杂 一 些 的 门 是 
怎样 的 呢 ? 下 面 我 们 用 CMOS 做 一 个 Vee 
与 非 门 。 A B CC D 

回忆 一 下 与 非 门 的 功能 ， 当 所 
有 输入 是 逻辑 1 时 它 的 输出 为 0。 在 
图 2-16 中 ， 我 们 看 到 ， 如 果 所 有 的 
输入 为 逻辑 1， 那 么 所 有 的 n 沟 道 器 
件 开启 ， 成 为 低 电阻 状态 。 所 有 的 p 
沟 道 器 件 则 关闭 ， 因 此 从 输出 往 器 
件 内 部 看 ， 可 以 看 到 一 个 低 电 阻 的 
通路 连接 到 接地 点 (逻辑 0)。 现 在 ， 
如 果 4 个 输入 A、B、C 和 DD 中 有 任何 
一 个 为 逻辑 状态 0， 那 么 它 的 n 沟 道 
MOSFET 处 于 高 电阻 状态 ， 而 p 沟 道 
器 件 处 于 低 电 阻 状 态 。 这 将 阻挡 住 
接地 点 与 输出 的 连接 ， 而 通过 p 沟 道 
器 件 形成 了 一 个 连 着 电源 的 低 电阻 = 
通路 。 图 2-16 一 个 具有 4 个 输入 的 CMOS 与 非 门 的 示意 图 。 

希望 现在 你 能 对 自己 刚 开始 掌握 的 来 自 Fairchild Semiconductor4 
硬件 技巧 和 洞察 力 更 有 信心 。 让 我 
们 分 析 一 个 电路 结构 ， 见 图 2-17， 这 
个 电路 常 被 称 为 “莎士比亚 电路 ”。 
你 可 以 任意 想像 这 个 设计 的 深层 含 
义 。 而 我 在 这 里 引入 这 个 例子 是 为 
了 证 明 不 是 所 有 的 计算 机 设计 者 都 图 2.17 冰鞋 比 亚 电路 
是 没有 幽默 感 的 怪人 。 


2.3 真 值 表 


本 章 要 讨论 的 最 后 一 个 概念 是 真 值 表 (truth table)。 当 我 们 前 面 讨 论 三 态 逻 辑 门 的 行为 时 
已 对 真 值 表 做 了 简单 介绍 。 然 而 ， 现 在 分 析 了 一 些 电路 后 正式 地 讨论 它 会 更 合适 。 真 值 表 就 
像 它 的 名 字 所 暗示 的 那样 ， 是 表示 一 个 丈 辑 门 或 系统 真 / 假 《TRUE/FALSE) 条 件 的 一 个 表格 。 
对 于 我 们 已 经 学 习 了 的 各 种 逻辑 门 ( 与 门 、 或 门 、 与 非 门 、 蜡 或 门 和 同 或 门 )， 我 们 已 经 用 口 
头 语言 的 形式 描述 了 它们 的 功能 。 

例如 ， 对 于 与 门 ， 我 们 说 :“ 当 且 仅 当 两 个 输入 均 为 1 时 与 门 的 输出 为 ]。” 这 确实 表达 了 它 的 
逻辑 含义 ， 但 我 们 需要 一 种 更 好 的 方式 来 表达 ， 从 而 设计 出 更 复杂 的 系统 。 我 们 所 用 的 方法 就 是 











数字 这 均 章 介 37 





为 逻辑 函数 创建 一 个 真 值 表 。 图 2-18 显 示 了 我 们 迄今 所 学 过 的 5 种 逻辑 门 电路 对 应 的 真 值 表 。 非 门 
太 简 单 了 ， 所 以 这 里 没有 包括 它 。 我 
们 已 经 看 到 过 三 态 门 的 真 值 表 了 ， 所 
以 它 不 在 此 图 中 。 

真 值 表 给 出 了 所 有 可 能 的 输入 
变量 A 和 B 所 对 应 的 输出 变量 C 的 值 。 
由 于 有 两 个 相互 独立 的 输入 变量 ， 
所 以 它们 的 取 值 可 以 是 4 种 组 合 中 的 
任意 一 个 。 参 考 图 2-18， 我 们 看 到 : 
当 且 仅 当 A 和 B 都 是 逻辑 1 时 与 门 的 
输出 C 才 是 1， 而 所 有 其 他 的 输入 组 
合 都 会 使 C 等 于 0。 类 似 地 ， 如 果 两 
个 输入 变量 中 有 任何 一 个 为 1 (包括 
两 者 都 为 1) , 则 或 门 的 输出 也 等 于 1。 

真 值 表 为 我 们 提供 了 一 种 简明 而 形 图 2-18 加 加 于 数 AND， OR、NAND、NOR 和 XOR 的 
象 的 方法 来 表达 逻辑 函数 的 功能 。 

假设 我 们 的 与 门 有 三 四 个 输入 ， 那 么 对 应 的 真 值 表 看 上 去 会 怎样 ?如 果 我 们 有 3 个 独立 的 输 
入 变量 A、B 和 C， 那 么 真 值 表 中 将 有 8 种 可 能 的 输入 组 合 (或 者 有 八 行 ) 来 代表 所 有 可 能 的 输入 
变量 组 合 。 对 于 一 个 3 输入 与 门 ， 这 8 个 输入 条 件 中 仅 有 一 个 ( 即 A = 1, B = 1,C = 1) 会 使 它 的 输 
出 端 产生 1。 对 于 4 个 输入 变量 ， 在 真 值 表 中 将 有 16 个 可 能 的 表 项 。 这 样 ， 推 而 广 之 ， 对 于 一 个 有 
N 个 独立 输入 变量 的 系统 ， 真 值 表 将 包含 有 2* 个 表 项 。 又 是 那个 麻烦 的 二 进 制 数 系统 ! 图 2-19 显 
示 了 一 个 4- 输 入 与 门 和 一 个 3- 输 入 或 门 
的 逻辑 符号 以 及 对 应 的 真 值 表 。 在 市 场 
上 ， 还 可 能 可 以 找到 有 5 个 或 更 多 输入 
端的 与 门 、 与 非 门 、 或 门 以 及 或 非 门 电 
路 。 还 有 一 种 与 非 门 电路 ， 它 被 设计 成 
可 以 扩展 到 任意 多 个 输入 信号 ， 虽 然 实 
际 上 并 没有 这 种 必要 。 

异 或 门 是 一 个 例外 ， 因 为 它 的 定 
义 决定 了 它 只 允许 有 两 个 输入 。 然 而 
我 们 也 可 以 设计 出 一 种 有 (比如 说 ) 5 
个 输入 (从 A 到 E) 和 1 个 输出 /的 电路 ， 
它 的 特点 是 当 且 仅 当 所 有 输入 都 相同 
时 f = 0。 当 然 这 就 不 是 异 或 门 了 ， 它 
是 某 种 其 他 的 电路 。 

考虑 图 2-20 中 的 那个 灰色 方块 ， 它 
表示 一 个 任意 数字 系统 ， 比 如 说 用 于 电 A 
梯 控 制 、 家 庭 供暖 和 空调 系统 或 火灾 报 3 3- 输 入 或 站 
警 控 制 器 的 电路 。 我 们 最 终 的 目的 是 用 ° 
我 们 刚才 讨论 过 的 那些 门 电路 来 设计 出 
这 个 灰 盒子 里 的 电路 。 无 论 它 是 什么 ， 图 2-19 一 个 4 输入 与 门 和 一 个 3 输入 或 门 的 真 值 表 和 门 线 图 
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我 们 都 要 首先 定义 每 个 输出 变量 和 它 相应 的 输入 变量 之 间 的 逻辑 关系 。 由 于 这 个 灰 盒 子 有 8 个 输 
入 变量 ， 所 以 我 们 将 从 这 个 电路 对 应 的 256 个 真 值 
表 表 项 开始 。 换 句 话说， 要 设计 这 个 电路 首先 就 要 
指定 每 种 可 能 的 输入 〈 从 a 到 h) 状态 所 对 应 的 X、 
Y 和 Z (输出 变量 ) 的 值 。 因 此 ， 如 果 我 们 设计 的 
是 一 个 大 楼 的 供暖 系 统 ， 而 且 一 个 来 自 温度 传感器 

的 信号 输入 表明 房间 的 温度 低 于 调 温 器 上 所 设 定 的 
值 ， 那 么 这 将 触发 一 个 适当 的 输出 反应 (比如 说 点 
燃 某 个 火炉 )。 


了 OoOSAw 
N<xXx 





图 2-20 一 个 数字 系统 设计 。 对 每 个 输出 变量 X、 


参考 图 2-20， 我 们 的 设计 过 程 可 以 从 创建 一 个 ei 
256 行 、11 列 的 表格 开始 ， 其 中 每 列 对 应 8 个 输入 变 站 " 
量 和 3 个 输出 变量 中 的 一 个 。 下 一 步 ， 我 们 将 艰 车 地 把 256 种 输入 变量 组 合 ( 从 00000000 到 
11111111) 填 入 到 真 值 表 中 。 最 后 ， 也 是 真正 工程 的 开始 ， 为 真 值 表 中 的 每 一 行 决定 如 何 给 输 
出 变量 赋值 。 

在 第 3 章 中 ， 我 们 将 更 详细 地 讨论 这 些 系统 的 设计 过 程 。 现 在 ， 作 为 一 个 总 结 ， 我 们 发 
现 我 们 已 经 以 两 种 既 不 相同 又 有 联系 的 方式 使 用 了 真 值 表 : 

1. 真 值 表 可 以 作为 一 种 表格 的 形式 来 描述 一 个 标准 门 ( 与 门 、 或 门 、 与 非 门 、 或 非 门 、 
异 或 门 或 三 态 门 ) 的 逻辑 行为 。 

2. 我 们 可 以 通过 使 用 真 值 表 来 描述 任何 一 个 复杂 的 数字 系统 ， 以 说 明 该 系统 将 如 何 工作 。 


总 结 


本 章 主要 内 容 如 下 : 

。 基本 的 门 电 路 ， 与 门 、 或 门 和 非 门 ， 并 看 到 了 很 多 可 以 由 它们 导出 的 更 复杂 的 门 电路 ， 
比如 与 非 门 、 或 非 门 及 异 或 门 。 

。 动态 〈 即 随时 间 变 化 ) 的 逻辑 值 可 以 用 一 个 逻辑 电 平 或 电压 对 时 间 的 图 来 表示 ， 这 种 
图 称 为 波形 。 

。 如何 由 电子 开关 元 件 、MOSFET 唱 体 管 产生 出 CMOS 钦 辑 门 。 

。 如 何 将 一 个 门 或 数字 电路 的 逻辑 行为 表达 为 一 个 真 值 表 。 
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习题 


1. 考虑 图 1-14 中 简单 的 与 电路 和 图 2-5 中 的 或 电路 。 改 变 图 中 的 逻辑 含义 ， 使 得 断 开 的 开关 
(无 电流 流 过 ) 为 真 ， 闭合 的 开关 为 假 。 同 时 ,改变 灯 泡 的 含义 ， 当 灯 不 亮 时 认为 输出 为 真 ， 
而 当 它 之 时 认为 是 假 。 在 这 种 表示 负 丈 辑 的 新 条 件 下 ， 两 个 电路 分 别 表示 什么 逻辑 功能 ? 

2. 用 CMOS 唱 体 管 画 出 2- 输 入 与 门 的 电路 结构 。 提 示 : 用 图 2-16 中 的 电路 作为 出 发 点 。 

3. 为 下 面 的 逻辑 等 式 构造 真 值 表 : 
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a. F=a*b*c+b*a 
b. F=a*b+ra*ctbhb*ce 


4. 当 点 X 处 的 电压 升 高 到 逻辑 电 平 1 时 ， 它 对 点 A 和 B 之 间 的 信号 会 产生 什么 影响 ? 


5. 为 奇偶 检测 电路 (parity detection circuit) 构造 真 值 表 。 这 个 电路 有 4 个 输入 变量 (a 到 d) 
和 一 个 输出 变量 X。 输 入 d 是 控制 信号 ， 当 d=1 时 电路 检测 奇 信和 号， 当 d=0 时 电路 检测 偶 信 和 号。 
言 号 的 奇偶 性 由 输入 端 4、b 和 c 确 定 ， 奇 信号 表示 它们 三 个 中 有 奇数 个 1， 偶 信和 号 意味 着 它 
们 中 有 偶数 个 1。 例 如 ， 如 果 d=1 且 (a, b,c)=(1,0,0)， 那 么 输出 X=1， 因 为 这 是 一 个 奇 信号 。 


6. 画 出 对 应 于 右 图 显示 的 逻辑 门 电路 的 真 值 表 。 





7. 图 2-8 所 示 为 蜡 或 函数 〈 即 方程 a @®@ b = X) 的 门 电路 结构 。 假 设 你 也 可 以 将 异 或 函数 表示 
为 : 
a Bb=~[~(a*b)*~(a* Bb)] 
请 仅 使 用 与 非 门 重新 设计 这 个 电路 。 
8. 考虑 图 2-3 中 所 示 的 电路 ， 假 设 我 们 将 图 中 的 与 门 用 (a) 或 门 和 (b) 异 或 门 来 代替 了 。 那 
么 当 输 入 A=0 和 A=1 时 ， 输 出 波形 将 分 别 是 怎样 的 ? 


第 3 章 异步 逻辑 简介 


学 习 目 标 


。 使 用 布尔 代数 定律 简化 和 计算 逻辑 公式 ， 并 将 它们 转化 为 逻辑 门 设计 ， 


。 创 建 真 值 表 来 描述 数字 电路 的 行为 ， 
。 用 卡 诺 图 来 简化 逻辑 设计 ， 


。 描 述 逻 辑 信 号 的 物理 属性 ， 比 如 上 升 时 间 、 下 降 时 间 和 脉冲 宽度 ， 


。 用 频率 和 周期 来 表示 系统 时 钟 信号 ， 


。 通 过 常用 的 工程 单位 记号 ， 如 Kilo ( 千 )、Mega ( 兆 )、Giga ( 吉 )、milli ( 毫 )、micro 


( 微 ) 和 nano ( 纳 ) 来 表示 不 同 数量 级 的 时 间 和 频率 。 


3.1 引言 


在 我 们 将 自己 陷入 严格 的 逻辑 分 析 和 设计 之 前 ， 最 好 先 哈 口 气 儿 ， 反 思 一 下 所 有 这 些 都 从 
何 而 来 。 我 们 可 能 有 一 种 错误 的 印象 ， 逻 辑 是 在 硅谷 随 着 晶体 管 的 发 明 而 诞生 和 发 展 起 来 的 。 


我 们 通常 将 现代 逻辑 分 析 的 起 源 追 溯 到 生 于 公元 前 384 年 的 古 希 腊 
哲学 家 亚 里 士 多 德 ， 他 被 公认 为 现代 逻辑 思想 之 父 。 因 此 ， 如 果 要 完 
全 精确 (也 可 能 有 点 慷慨 ) ， 我 们 应 该 称 亚 里 士 多 德 为 现代 数字 计算 机 


会 发 现 很 难 将 它 和 亚 里 士 多 德 的 逻辑 联系 到 一 起 ， 不 过 下 面 的 简单 例 
子 可 以 给 我 们 一 些 提示 。 

亚 里 士 多 德 逻辑 的 核心 是 演绎 (deduction) 的 概念 。 如 果 你 看 过 
早期 福尔摩斯 侦探 的 电影 ， 那 么 你 可 能 更 熟悉 演绎 这 个 概念 ， 但 演绎 
推理 的 思想 并 不 是 福尔摩斯 发 明 的 ， 而 是 亚 里 士 多 德 发 明 的 。 





图 3-1 亚 里 士 多 德 


亚 里 土 多 德 提出 一 个 演绎 断言 应 该 有 “假设 的 条 件 ” 或 者 断言 的 前 提 (Premise)， 而 “ 必 


然 得 到 的 结果 ”就 是 结论 。 

一 个 经 常 被 引用 的 例子 是 : 

1. 人 总 会 死 的 ; 

2. 希腊 人 是 人 ， 

3. 因此 ， 和 希腊 人 也 会 死 的 。 

我 们 可 以 将 这 个 例子 用 一 种 稍微 不 同 的 形式 表述 : 

1. 令 A 表 示 “ 人 类 总 会 死 ” 这 个 命题 的 状态 ， 即 “人 类 总 会 死 可 
能 是 真 也 可 能 是 假 ， 

2. 令 B 表 示 希 腊 人 的 状态 ,“ 和 希腊 人 是 人 类 的 一 种 ”可 能 为 真 也 可 
能 为 假 ; 

3. 因此 ， 结 论 为 真 的 唯一 条 件 是 ， 如 果 A 为 真 且 B 为 真 那 么 希腊 人 
也 会 死 。 或 者 说 ，C (表示 希腊 人 是 否 会 死 ) =A* B。 

我 们 可 以 将 处 理 逻 辑 表达 式 的 能 力 追 溯 到 英国 数学 家 和 有 罗 辑 学 家 





图 3-2 乔治 : 布尔 
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乔治 - 布尔 (1816 一 1864)。 

“]854 年 ， 布 尔 在 《the Laws of Thought》 上 发 表 了 一 篇 研究 报告 ， 基 于 它 人 们 创建 了 逻辑 
和 概率 的 数学 理论 。 布 尔 用 一 种 新 的 方式 将 逻辑 简化 为 简单 的 代数 符号 ， 并 将 它 与 数学 运算 结 
合 起 来 。 他 指出 了 代数 符号 和 逻辑 形式 符号 的 类 似 性 ， 从 而 开创 了 称 为 布尔 代数 【Boolean 
algebra) 的 逻辑 代数 学 科 。 现 在 ， 布 尔 代数 已 广泛 应 用 于 计算 机 建造 、 开 关 电 路 等 方面 。 “ 

布尔 代数 给 我 们 提供 了 设计 复杂 逻辑 系统 的 一 系列 工具 ，、 并 且 保 证 设计 出 的 电路 将 按 我 
们 想 要 的 方式 进行 工作 。 此 外 ， 就 像 你 将 看 到 的 ， 设 计数 字 电 路 的 过 程 通常 会 导致 相当 元 余 
的 结构 ， 从 而 需要 对 其 加 以 简化 。 布 尔 代 数 为 我 们 提供 了 简化 电路 设计 所 需 的 工具 ， 并 确保 
它 能 以 最 少 的 硬件 实现 设计 时 想 要 的 功能 。 作 为 电子 工程 师 ， 这 恰恰 是 我 们 最 需要 的 分 析 工 
具 ， 因 为 分 派 给 我 们 的 任务 经 常 是 要 求 用 最 低 的 成 本 完成 有 效 的 设计 。 

在 设计 数字 计算 系统 有 关 的 工作 中 ， 有 两 个 明显 不 同 的 二 进 制 系统 需要 我 们 熟悉 。 在 本 
书 前 面 的 内 容 中 ， 我 们 已 经 介绍 了 二 进 制 数 体系 ， 它 很 方便 ， 因 为 我 们 需要 计算 机 能 够 操作 
超过 一 位 长 度 的 数字 。 另 一 个 部 分 就 是 对 硬件 进行 如 同 对 硬件 数字 系统 的 操作 。 为 了 理解 如 
何 处 理 这 些 数字 ， 我 们 需要 学 习 二 进 制 逻辑 代数 即 布尔 代数 的 一 些 原理 。 

因此 ， 这 个 过 程 的 第 一 步 就 是 给 出 一 些 布尔 代数 的 定律 。 在 大 多 数 情况 下 ， 这 些 定律 都 是 
显而易见 的 。 而 对 另 一 些 情况 ， 你 可 能 需要 仔细 思考 ， 直 到 意识 到 我 们 在 逻辑 运算 中 涉及 的 
变量 仅 能 取 两 种 可 能 的 值 ， 而 不 是 对 那些 可 取 连 续 数值 的 变量 进行 加 法 和 乘法 。 此 外 ， 请 注 
意 表示 逻辑 “ 非 ” 的 记号 并 没有 统一 ， 因 此 可 能 有 多 种 表示 方法 。 这 部 分 是 历史 原因 造成 的 ， 
因为 可 打印 的 基本 ASCII 字 符 集中 并 没有 提供 一 个 简单 的 方式 来 表示 反 变 量 ， 即 在 变量 上 面 画 
一 条 横 线 加 以 表示 ， 如 第 2 章 图 2-4 所 示 。 因 此 ， 你 可 能 会 看 到 几 种 不 同 的 “ 非 ” 条 件 的 表示 。 
例如 ，/A、~A、*A 和 A* 都 常 被 用 于 表示 “ 非 A”(NOT A)。 我 不 打算 使 用 *A 和 A*， 因 为 它 
太 容 易 和 与 符号 混淆 了 。 然 而 ， 为 了 使 等 式 更 容易 理解 ， 我 偶尔 会 使 用 ~A 或 /A 来 表示 非 A 的 
含义 。 在 大 多 数 情 况 下 ， 我 会 用 字母 上 面 加 横 线 的 方式 来 表示 非 运算 。 很 抱歉 没 能 统一 。 


3.2 布尔 代数 定律 


互补 律 
。 第 一 互补 律 若 A=0, 则 A=1， 若 A=l, 则 4=0 
。 第 二 互补 律 A* A=0 
。 第 三 互补 律 A+ 4=1 
。 双重 互补 律 /(A)=/NW/A=A 
交换 律 
。 AND 交 换 律 A*B=B*A 
。 OR 交换 律 A+B=B+A 
结合 律 
。AND 结 合 律 A*(B*C) = C*(A * B) 


。OR 结 合 律 A+(B+C)=C+(A+B) 
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结合 律 使 我 们 可 以 组 合 三 个 以 上 的 变量 ， 它 告诉 我 们 可 以 以 任何 顺序 对 变量 进行 组 合 而 
不 影响 最 后 的 结果 。 正 如 我 们 在 第 2 章 所 看 到 的 ， 正 是 这 条 定律 允许 我 们 通过 组 合 两 个 2- 输 入 
或 门 得 到 一 个 逻辑 上 等 价 的 3- 输 入 或 门 。 应 该 注意 ， 当 我 们 说 逻辑 等 价 的 时 候 其 实 忽略 了 电 
学 上 的 区 别 。 正 如 我 们 已 经 看 到 的 ， 在 任何 实际 的 系统 中 都 要 考虑 罗 辑 门 的 时 序 特 征 。 











分 配 律 
。 第 一 分 配 律 A*(B+C)=(A*B)+(A*C) 
。 第 二 分 配 律 A+(B*C)=(A+B)*(A+C) 
分 配 律 看 上 去 非常 像 代 数 中 的 提取 公 因 子 和 乘法 展开 。 
重 言 律 
。 第 一 重 言 律 A*A=A 车 A=1, 则 A*A=1; 若 A=0, 则 A*A=0。 因 此 表达 式 简 化 为 A 
。 第 二 重 言 律 A+A=A 若 A=1, 则 1+ 1I=1， 若 A=0, 则 0+0=0。 同 样 ， 表 达 式 简化 为 A 
带 常数 的 重 言 律 
*sA+l=!1 
。A* 1 = 和 A 
。A*+0=0 
。A +0=A 
吸收 律 
。 第 一 吸收 律 A*(A+B)=A 
“第 二 吸收 律 A+(A*B)=A 





得 出 这 个 公式 需要 点 技巧 。 考 虑 表达 式 : A * (A + B)。 

如 果 A = 1， 它 将 变 成 1* (1 + B)。 根 据 带 常数 的 重 言 律 ，1 + B = 1， 因 此 就 剩 下 1 + 1 = 1。 
如 条 A = 0， 第 一 个 表达 式 现在 就 会 变 成 0 * (0 + B)。 再 次 应 用 带 常数 的 重 言 律 ， 它 会 缩减 为 
0 * B， 它 必然 等 于 0。 因 此 ， 无 论 在 哪 种 情况 下 ， 表 达 式 的 值 都 等 于 A 的 值 ， 而 B 的 值 对 结 
果 不 产 生 影响 。 


德 ， 床 根 定理 





。 情 况 1: (4*B)=A+B 
。 情 况 2: (4+B=A*B 





德 . 摩根 定理 非常 重要 ， 因 为 它 表明 了 与 函数 和 或 函数 的 关系 ， 以 及 正 逻 辑 和 人 负 远 辑 的 
概念 。 而 且 ， 德 ， 摩根 定理 也 表明 任何 用 与 门 和 反 相 器 ( 非 门 ) 构 成 的 逻辑 函数 都 可 被 或 门 
和 反 相 器 组 成 的 电路 所 复制 。 此 外 ， 请 注意 上 面 两 个 方程 的 左边 都 恰好 分 别 是 组 合 逐 辑 函 数 
NAND 和 NOR 。 

在 继续 学 习 之 前 ， 我 们 应 该 讨论 一 下 德 . 摩根 定理 和 逻辑 极 性 的 关系 。 到 目前 为 止 ， 我 
们 一 直 采 用 的 是 正 向 (高 电压 信号 为 1) 和 人 负 向 ( 低 电 压 信 号 为 0) 的 习惯 。 这 是 介绍 逻辑 知 
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识 的 很 好 的 方式 ， 因 为 真 / 假 、1/0 和 高 / 低 比 较 容 易 看 成 是 一 致 的 概念 。 然 而 ， 当 真 和 假 只 是 
逻辑 意义 的 时 候 ， 从 电路 角度 来 看 我 们 完全 可 以 任意 地 定义 逻辑 规则 。 

这 并 不 是 说 如 果 我 们 将 电学 上 的 1 和 0 交换 ， 一 个 与 门 电路 就 仍然 代表 一 个 与 门 。 不 会 这 
样 的 ， 它 其 实 变 成 了 一 个 或 门 。 类 似 地 ， 如 果 我 们 交换 1 和 0 使 得 低 电 压 表示 1， 高 电压 表示 0， 
那么 或 门将 变 成 与 门 。 你 可 以 根据 第 1 课 中 学 到 的 与 门 与 或 门 的 真 值 表 来 自己 验证 这 一 点 。 如 
果 将 与 门 的 真 值 表 中 所 有 1 换 成 O09， 所 有 0 换 成 1， 那 么 你 将 看 到 这 其 实 变 成 了 或 门 的 真 值 表 
( 负 逻 辑 )。 用 同样 的 方法 试 试 或 门 ， 你 会 发 现 最 后 得 到 了 负 有 还 辑 下 的 与 门 。 

应 记 住 的 重要 一 点 是 ， 如 果 采 用 逻辑 1 是 高 电压 的 正 逻辑 ， 相 同 的 电子 电路 将 实现 与 门 的 
逻辑 行为 。 这 样 ， 逻 辑 1 可 以 是 任何 高 于 +3V 的 电压 ， 而 逻辑 0 可 以 是 任何 低 于 0.5V 的 电压 。 
我 们 称 这 个 是 正 运 辑 。 不 过 ， 如 果 我 们 反 过 来 定义 什么 电压 代表 1 和 什么 电压 代表 0 ， 那 么 同 
样 的 电路 就 变 成 了 逻辑 或 函数 ( 负 逻 辑 ，negative logic)。 

因此 ， 在 数字 系统 中 ， 我 们 通常 会 按 需 要 定义 真 和 假 ， 以 便 能 实现 出 最 有 效 的 电路 设计 。 
既然 不 能 让 真 或 假 一 直 保 持 相 同 的 电学 意义 ， 我 们 通常 会 用 到 一 个 术语 置 有 效 (assert)。 当 
说 一 个 信号 被 置 有 效 ， 就 表明 它 处 于 活动 状态 ， 处 于 活动 状态 可 通过 从 低 电 位 变 为 高 电位 ， 
或 者 相反 从 高 电位 变 为 低 电 位 来 达到 。 一 会 儿 当 我 们 讨论 存储 器 系统 的 时 候 ， 你 将 会 看 到 大 
多 数 的 存储 器 控制 信号 都 是 低 有 效 的 ， 但 存储 器 单元 的 地 址 和 存储 于 地 址 的 数据 信号 则 是 高 
有 效 的 。 在 第 2 章 我 们 讨论 三 态 门 的 逻辑 行为 时 你 已 经 看 到 了 这 种 情况 ， 其 中 当 输 出 使 能 端 
( OE ) 被 置 为 低 有 效 时 三 态 门 的 输出 进入 低 阻 状态 。 这 并 不 意味 着 OE 信号 为 假 (或 负 逐 辑 
里 的 真 )， 它 只 表示 这 个 信号 在 低 状 态 时 进入 活动 状态 。 

在 图 2-20 中 ， 我 们 考虑 了 一 个 最 一 般 的 逻辑 系统 设计 的 情况 。 其 中 ，3 个 输出 变量 中 的 每 
一 个 都 被 定义 成 了 多 达 8 个 输入 变量 的 函数 ， 即 X =f (a, b,c, d, e, f, g, h)， 等 等 。 请 注意 输出 
变量 X、Y 和 Z 是 关于 所 有 输入 变量 a 到 h 或 其 中 一 部 分 的 各 自 独立 的 函数 。 现 在 我 们 需要 解决 
的 问题 可 分 为 下 面 4 个 部 分 : 

1. 我 们 如 何 用 真 值 表 来 描述 我 们 想 要 这 个 数字 系统 来 实现 的 功能 ?这 恰好 是 定义 设计 。 

2. 一 旦 有 了 想 要 的 功能 (由 真 值 表 所 定义 )， 我 们 怎样 用 布尔 代数 的 法 则 将 真 值 表 转 换 为 
这 个 系统 的 布尔 代数 表达 式 ? 

3. 当 我 们 将 这 个 设计 表示 为 一 系列 方程 之 后 ， 能 否 使 用 布尔 代数 的 某 些 定律 来 简化 这 些 
方程 ? 

4. 最 后 ， 当 我 们 用 最 简单 的 代数 形式 描述 了 这 个 系统 的 方程 之 后 ， 该 怎样 将 方程 转化 为 
一 个 真实 的 电路 设计 ? 

稍 过 一 会 儿 ， 我 们 将 看 到 如 果 依 次 解决 这 些 问题 ， 以 及 如 何 用 布尔 代数 的 定律 将 方程 加 
以 简化 。 但 是 ， 如 果 事 先知 道 输 出 Y 仅 依赖 于 输入 信号 c、d 和 g， 那 么 我 们 可 以 马上 将 Y 的 真 
值 表 中 的 输入 变量 限制 为 ?个 ， 从 而 简化 这 个 设计 任务 。 很 快 我 们 将 看 到 ， 一 般 的 情况 可 以 变 
成 简化 的 情况 ， 所 以 无 论 用 哪 种 方式 最 终 都 能 达到 相同 的 结果 。 经 常 遇 到 的 情况 往往 是 你 事 
先 并 不 知道 某 个 输出 变量 和 某 些 输入 变量 之 间 没 有 关系 ， 而 在 进行 了 所 有 的 代数 化 简 工 作 之 
后 你 才 发 现 这 样 的 情况 。 

图 3-3 是 一 个 随意 的 真 值 表 设 计 例子 ， 它 描述 的 不 是 一 个 实际 的 系统 ， 至 少 我 还 想 不 出 它 
能 代表 哪 种 实际 的 系统 。 我 构造 出 这 个 真 值 表 只 是 为 了 进行 一 遍 上 述 的 逻辑 简化 过 程 。 

输出 E 和 F 是 两 个 独立 的 变量 , 它们 是 依赖 于 输入 变量 A 到 D 的 两 个 函数 。 由 于 有 4 个 输入 变量 ， 
所 以 真 值 表 中 总 共 包 括 了 2* 即 16 种 可 能 的 组 合 ， 代 表 了 所 有 可 能 的 输入 变量 的 取 值 情况 。 也 请 注 
意 每 个 输入 变量 的 取 值 是 如 何 写 在 同一 列 中 的 , 用 这 种 方法 可 以 保证 没有 漏 掉 或 者 重复 一 些 情况 。 
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因为 这 是 个 自己 造 的 例子 ， 所 以 输出 变量 和 输入 变量 之 间 的 关系 并 没有 实际 的 意义 ， 也 就 是 说 我 
只 是 随意 地 放 了 一 些 1 和 0 在 E 和 F 的 列 中 使 这 
个 例子 看 上 去 有 点 意思 。 如 果 这 个 例题 是 一 个 
实际 数字 设计 中 的 一 部 分 ， 设 计 者 就 应 该 考虑 
真 值 表 中 的 每 一 行 并 决定 每 个 输出 变量 应 对 特 
定 的 输入 信号 组 合 如 何 相 应 。 








例如 ， 假 设 我 们 正在 设计 一 个 简单 的 防 一 一 
盗 报警 系统 控制 器 。 不 妨 认为 输出 E 控 制 一 个 请 
房间 内 的 蜂 鸣 器 ， 而 输出 F 控 制 一 个 足以 唤醒 一 一 
邻居 的 大 音量 喇叭 。 输 入 A、B 和 C 是 检测 入 一 0 一 
侵 者 的 传感器 ， 输 入 D 是 控制 防盗 报警 系统 是 0 
OO | 0 | 
否 开启 的 按钮 。 如 果 D = 0， 那 么 整个 系统 不 一 一 一。 一 





工作 ， 如 果 D = 1， 则 系统 工作 ， 喇 叭 会 响 。 E = A*B C*D + A*B*C:D + ArBxCxD 
在 这 个 例子 中 ， 对 于 D = 0 时 的 所 有 真 值 F = A 书本 二 + ABC 垣 


表 中 的 条 件 ， 我 们 都 不 允许 输出 有 效 ， 不 论 
输入 A、B 和 C 处 于 什么 状态 。 而 当 D = 1 时 ， 图 3-3 一 个 数字 系统 设计 例子 中 的 真 值 表 。 输 出 E 
我 们 需要 考虑 其 他 输入 的 影响 。 这 时 ， 真 值 和 F 可 根据 真 值 表 写成 乘积 和 《最 小 项 ) 形式 
表 中 的 每 一 行 都 给 出 了 一 组 新 的 条 件 ， 你 需要 对 输出 值 进行 独立 的 评估 。 有 时 候 ， 如 果 某 个 
变量 (D = 0) 对 系统 有 全 局 影响 ， 你 可 以 作出 一 些 显 然 的 决定 。 

虽然 图 3-3 不 代表 一 个 实际 系统 ， 让 我 们 还 是 暂时 假设 它 是 真实 的 。 我 们 考虑 输出 变量 F， 
它 的 逻辑 方程 为 ; 

. 第 1 项 第 2 项 

该 方程 告诉 我 们 F 在 两 组 不 同 的 输入 情况 下 为 真 。 无 论 是 所 有 输入 都 为 假 (第 1 项 )， 还 是 A 和 
D 为 假 而 B 和 C 为 真 (第 2 项 )， 都 会 使 输出 变量 F 为 真 。 我 们 怎么 知道 是 这 样 的 呢 ?” 是 我 们 设计 
它 这 么 工作 的 ! 作为 负责 这 个 数字 设计 的 工程 师 ， 我 们 指定 在 这 两 组 输入 情况 下 输出 F 为 真 。 

我 们 称 上 面 的 逻辑 方程 为 乘积 和 形式 (sum of products form) ， 或 最 小 项 形式 (minterm 
form)。 还 有 另 一 种 称 为 最 大 项 形式 (maxterm form),， 它 可 以 表示 为 和 的 乘积 (product of sums ) 。 
这 两 种 形式 可 以 根据 德 . 摩根 定理 相互 转换 。 为 了 达到 效果 ， 我 们 将 仅 讨 论 最 小 项 形式 。 

记 住 ， 这 个 真 值 表 是 某 个 数字 系统 设计 的 例子 。 它 在 某 种 程度 上 粗糙 地 表示 了 这 个 系统 
的 设计 描述 。 因 此 ， 我 们 并 不 知道 为 什么 输出 变量 E 和 F 对 应 的 列 上 有 些 行为 0， 而 有 些 行为 1， 
这 些 都 来 自 于 系统 的 设计 要 求 。 我 们 是 工程 师 ， 而 那个 正 处 于 工程 设计 阶段 。 紧 接 在 设计 阶 
段 后 面 的 是 实现 阶段 。 因 此 ， 下 面 让 我 们 解决 这 个 设计 的 实现 。 1 

参考 图 3-3， 我 们 看 到 输出 变量 E 在 输入 变量 A 到 D 的 三 种 可 能 组 合 情 况 下 为 真 ; 

1. A*B*C*D 

2. A*B*C*D 

3. A*B*C*D 

我 们 可 以 把 这 个 关系 用 一 个 逻辑 方程 加 以 表示 : 

E=A*B*C*D+A*B*C*D+A*B*C*D 


对 三 个 与 运算 的 结果 进行 或 运算 意味 着 ， 三 个 与 项 中 任何 一 个 都 可 以 导致 E 为 真 。 因 此 ，- 
对 于 组 合 《combination)， 我 们 用 与 运算 。 对 于 聚会 (aggregation)， 我 们 用 或 运算 。 类 似 地 ， 
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我 们 可 以 把 F 的 值 表 示 为 : 
| | F=A*B*C*D+A*B*C*D 

到 现在 为 止 ， 将 这 些 方程 转化 为 逻辑 门 电路 并 不 很 困难 ， 这 样 我 们 就 把 这 个 数字 逻辑 系统 
做 出 来 了 。 是 这 样 吗 ? 事实 上 ， 这 种 看 法 在 一 定 程度 上 是 对 的 。 我 们 仍然 不 知道 这 些 项 中 是 否 
有 元 余 ， 我 们 是 否 可 以 消除 这 些 宛 余 从 而 使 电路 更 容易 建造 出 来 。 按 真 值 表 来 建造 系统 自然 会 
带 来 元 余 ， 因 为 我 们 单独 考虑 真 值 表 中 的 每 一 行 ， 某 些 重复 自然 有 可 能 混 进 我 们 的 方程 中 。 

使 用 布尔 代数 定律 ， 我 们 可 以 对 这 些 方程 做 进一步 处 理 将 其 简化 。 最 简单 的 有 宛 余 项 的 
方程 形式 是 A* B+ A*B。 

很 容易 证 明 A*B+A*B =A。 为 什么 呢 ? 

1. 首先 用 分 配 律 A*B+A*B=A*(B+B) 

2. 再 根据 第 3 互补 律 B+B=1 

3. 最 后 ，A*1=A 

因此 ， 如 果 我 们 能 对 某 些 项 进行 组 合 从 而 “提取 ”一 些 公共 的 与 项 ， 并 且 剩 下 的 项 正好 
是 一 个 表达 式 和 其 自身 补 的 或 ， 那 么 我 们 就 可 以 直接 把 这 个 剩 下 的 项 扔 掉 。 


3.3 卡 诺 图 


在 一 篇 经 典 的 论文 中 ，Karnaugh3 (发 音 为 CAR NO, 译 为 “ 卡 诺 ”) 提出 了 一 种 图 形 化 的 
方法 用 于 简化 由 真 值 表 得 到 的 乘积 和 方程 ， 而 不 需要 直接 使 用 布尔 代数 。 卡 诺 图 就 是 对 下 面 
布尔 代数 简化 公式 的 图 形 解决 方法 : 

A*B+A*B=A 

由 于 真 值 表 的 构造 方式 所 自然 导致 的 元 余 ， 这 种 简化 过 程 是 逻辑 表达 式 简 化 中 最 常见 的 。 

可 以 遵循 一 些 简单 的 规则 把 卡 诺 图 (也 称 K 图 ) 构造 出 来 ， 图 3-4 显 示 了 含 3 个 变量 、4 个 
变量 和 5 个 变量 的 K 图 的 构造 过 程 。 


3- 输 入 变量 问题 的 卡 诺 图 4- 输 入 变量 问题 的 卡 诺 图 


AB AB AB AB 


AB AB AB AB 


5- 输 入 变量 问题 的 卡 诺 图 _ 


注意 : ， 

1. 灰色 的 边 被 认为 是 相 邻 的 

2. 4 个 角 上 的 单元 被 认为 彼此 相 部 

3. 对 变量 标记 进行 组 织 ,使 得 沿 一 个 个 单 
元 看 过 去 每 次 具有 一 个 变量 发 生 改 变 

4. 对 角 线 上 的 单元 不 是 相 邻 的 





图 3-4 创建 3 个 变量 、4 个 变量 和 5 个 变量 的 卡 诺 图 的 格式 
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请 看 含 4 个 输入 变量 的 K 图 。 注 意图 中 垂直 的 深 灰色 边 和 水 平 的 浅 灰 色 边 ， 它 们 应 分 别 被 
[55| 和 看 成 是 相 邻 的 。 换 句 话说 ， 整 个 图 在 水 平方 向 和 垂直 方向 都 可 以 被 认为 是 卷 成 了 圆 简 形 状 。 
标识 图 中 各 列 的 方法 看 上 去 非常 奇怪 ,但 当 你 仔细 观察 时 会 发 现 ， 沿 着 图 的 顶部 穿 过 各 
项 ， 变 量 A 和 B 的 形式 是 按 下 面 的 规则 发 生变 化 的 : 
2. 所 有 可 能 的 组 合 都 表示 出 来 了 ， 
3. 第 1 列 和 第 4 列 对 应 的 变量 是 相 邻 的 。 
图 3-4 中 所 列 的 变量 顺序 其 实 不 是 唯一 可 行 的 ， 那 只 是 我 最 习惯 使 用 的 ， 而 且 根 据 我 的 经 
验 这 样 写 能 够 画 出 正确 的 卡 诺 图 。 一 般 来 说 ， 很 容易 列 出 正确 的 变量 集合 ， 但 要 使 它们 的 顺序 
无 误 倒 不 是 很 容易 ， 错 误 的 顺序 必然 导致 错误 的 结果 。 俗 话说 得 好 :“ 种 瓜 得 瓜 ， 种 豆 得 豆 ”。 
应 该 注意 的 另 一 点 是 ， 对 于 变量 数 为 4 或 更 少 的 问题 借助 K 图 能 够 生成 出 最 简化 的 方程 形 
式 。 而 对 于 含 5 个 或 更 多 变量 的 图 ， 要 得 到 最 好 的 结果 需 使 用 三 维 K 图 ， 其 中 包含 多 个 4 变量 K 
图 所 代表 的 平面 。 为 了 讨论 方便 ， 当 后 面 使 用 5 变量 的 K 图 并 且 它 需要 进一步 简化 时 ， 我 们 会 
指出 来 。 也 就 是 说 ， 基 于 平面 的 K 图 再 做 一 些 布尔 代数 推导 比 画 出 三 维 的 K 图 要 容易 实现 。 
我 们 可 以 将 用 图 简化 真 值 表 所 对 应 逻辑 函数 的 过 程 总 结 为 : 
1.K 图 中 单元 的 数目 等 于 输入 变量 状态 的 所 有 可 能 的 组 合 数 。 例 如 : 
a. 对 3 个 变量 A、B、C， 有 8 个 单元 
b. 对 4 个 变量 A、B、C、D， 有 16 个 单元 
c. 对 5 个 变量 A、B、C、D、E， 有 32 个 单元 
| 56 | 因此 单元 的 数目 = 2 输入 变 基业 日 。 
2. 构造 K 图 ， 使 得 从 左 到 右 的 各 列 或 从 上 到 下 的 各 行 所 对 应 的 变量 标识 每 次 仅 有 一 个 变量 变 
化 。 看 看 图 3-5， 注 意 第 一 列 和 最 后 一 列 以 及 第 一 行 和 最 后 一 行 都 被 认为 是 相 邻 的 ， 就 像 这 个 图 真 
是 被 卷 成 一 个 圆 简 形 状 。 此 外 还 要 注意 对 角 线 上 的 第 一 个 单元 和 最 后 一 个 单元 不 被 看 作 是 相 邻 的 。 


X 二 BC +AB +AC 


简化 后 的 方程 1 





图 3-5 将 真 值 表 翻 译 为 K 图 。 每 个 K 图 的 单元 代表 一 个 独立 变量 的 组 合 。 
对 应 于 真 值 表 中 输出 为 1 的 行 ， 相 应 的 K 图 单元 也 填 上 “1” 
3. 为 每 一 个 输出 变量 构造 一 个 单独 的 K 图 。 
4. 逐个 检查 真 值 表 中 的 行 ， 若 该 行 输出 为 “1” 则 对 应 地 在 K 图 上 的 那个 单元 上 填 “1”。 
5. 将 K 图 中 含 1 上 且 相 邻 的 单元 圈 出 来 ， 并 且 让 这 个 圈 中 的 1 尽 可 能 多 ， 这 样 圈 出 的 相 邻 单元 
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中 单元 的 数目 可 能 是 2、4、8、16、32， 等 等 。 

6. 你 可 能 需要 画 多 个 圈 ， 而 一 个 单元 可 以 同时 在 多 个 圈 中 ,但 每 个 圈 必 须 包含 至 少 一 个 
不 在 其 他 圈 中 的 单元 。 和 仔细 检查 图 中 是 否 有 某 个 圈 中 所 有 单元 都 属于 另 一 个 图 ， 如 果 找 到 就 
把 被 包含 的 圈 删 除 。 

7. 最 后 ， 通 过 删除 圈 中 同时 包含 自身 以 及 补 的 变量 来 简化 圈 对 应 的 表达 式 ， 然 后 将 各 个 
圈 对 应 的 最 小 项 形式 “或 ”起 来 就 得 到 了 最 终 简 化 的 方程 。 

可 能 用 一 个 例子 来 解释 会 更 清楚 ， 图 3-5 显 示 了 这 个 过 程 。 我 们 有 一 -个 含 3 个 独立 输入 变 
量 A、B、C 和 一 个 输出 变量 x 的 真 值 表 ，3 个 输入 变量 表明 真 值 表 中 应 该 有 8 行 。 在 图 3-5 中 ， 
有 4 行 的 “x” 列 处 为 1!1， 因 此 我 们 可 以 为 x 写 下 没有 简化 的 逻辑 方程 ; 

x= A*B*C+A*B*C+A*B*C+A*B*C 
。 现 在 看 图 3-5， 真 值 表 对 应 的 K 图 显示 于 右边 。 与 真 值 表 保 持 一 致 ， 对 应 于 变量 “x” 的 
K 图 中 有 4 个 单元 为 “1”。 我 们 可 以 画 出 下 面 的 3 个 圈 : 

。 浅 灰色 的 圈 包 括 A*B*C 和 A**C 两 项 

。 灰 色 的 圈 包 括 A4*B*C 和 A*B*C 两 项 

。 深 灰色 的 圈 包 括 A*B*C 和 A*B*C 两 项 

然后 ， 我 们 可 以 从 浅 灰 色 圈 中 删除 变量 A， 从 灰色 圈 中 删除 B， 从 深 灰 色 圈 中 删除 C。 由 
此 得 到 的 方程 为 ，x = B*C +A*B+A*C ， 这 就 是 原始 方程 的 简化 版 本 。 

请 注意 在 这 个 例子 中 ， 代 表 输 入 变量 状态 4*B*C 的 单元 是 公共 单元 ， 它 在 三 个 圈 中 都 出 
现 了 。 然 而 ,每 个 圈 中 还 有 一 个 单元 不 被 其 他 的 圈 所 包含 ， 所 以 我 们 画 出 的 这 3 个 圈 符 合 要 求 。 

在 我 们 继续 介绍 新 内 容 之 前 ， 应 该 看 看 使 用 乔治 : 布尔 提出 的 这 些 代数 法 则 是 否 也 能 推 
导出 相同 的 简化 方程 式 。 下 面 是 用 布尔 代数 简化 这 个 方程 的 步骤 : 


步骤 1 X= A*B*C+A+B*C+A*B*+C+A*B*C 来 自 真 值 表 
步骤 2 x= A*B*C+A*B*C+A*B*(C+C) 第 一 分 配 律 
步骤 3 x= A*B*C+A*B*C+A*B 第 一 互补 律 
步骤 4 x=A*B*C+A*(B*C +B) 第 一 分 配 律 
步骤 5 x=A*B*C+A*[(B+C)*(B+B)] 第 二 分 配 律 
步骤 6 Xx= A*B*C+A*(B+C) 互补 律 

步骤 7 x= A*B*C+A*B+A*C 第 一 分 配 律 
步骤 8 x=B*(A*C+A)+A*C 第 一 分 配 律 
步骤 9 x=B*[(A+A*(C+A+A*C 第 二 分 配 律 
步骤 10 x=B*(C+A)+A*C 第 一 分 配 律 
步骤 11 x=B*C+B*A+A*C 第 一 分 配 律 





让 我 们 再 看 看 一 个 稍微 复杂 一 点 的 例子 。 图 3-6 显 示 了 一 -个 含 两 个 输出 变量 的 4- 输 入 变量 
问题 ， 同 样 这 也 是 一 个 人 造 的 例子 ， 就 我 所 知 它 不 代表 任何 一 个 实际 系统 。 如 果 我 们 真 的 要 
建造 一 个 数字 系统 ， 那 么 系统 需求 说 明 会 给 出 每 个 输出 对 于 给 定 输入 变量 集 的 状态 。 

如 果 看 了 为 变量 “X” 夯 的 K 图 ， 你 会 发 现 可 构造 出 两 个 简化 的 圈 。 其 中 灰色 的 圈 被 K 图 
的 两 个 竖 边 折断 ， 因 为 这 两 个 边 被 看 成 是 相 邻 的 。 类 似 地 ， 深 灰色 的 圈 被 K 图 的 上 下 两 个 水 平 
边 折 断 。 你 可 能 想 知道 为 什么 我 们 不 为 4* B*C*D 和 A*B*C*D 两 项 出 画 一 个 圈 。 原 因 是 
这 两 项 都 已 经 在 其 他 的 圈 中 ， 所 以 我 们 不 能 再 画 一 个 圈 。 要 再 画 出 第 三 个 图 ， 除 非 有 一 个 或 ”[58] 
更 多 的 项 不 被 任何 圈 所 包含 。 
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借助 K 图 得 到 的 结果 并 不 总 是 最 简化 的 ， 但 它 会 非常 接近 最 简化 的 方程 。 对 于 多 于 4 个 变量 的 K 
图 ， 尤 其 要 注意 这 一 点 。 事 实 上 ， 5 个 变量 的 K 图 应 该 表示 为 两 个 4 变量 K 图 ， 其 中 一 个 在 另 一 个 的 
上 面 。 因 此 在 使 用 K 图 方法 对 逻辑 方程 进 
行 简化 后 ， 别 忘 了 可 能 还 需要 用 布尔 代 
数 以 及 德 . 摩根 定理 将 其 进一步 简化 ， 
以 得 到 最 简化 的 形式 。 

作为 最 后 一 步 ， 让 我 们 把 简化 后 的 
逻辑 方程 转换 为 一 个 实际 的 门 电路 实 
现 。 我 们 将 使 用 图 3-5 中 的 那个 简化 后 的 
逻辑 方程 ， 并 将 其 转换 为 等 效 的 门 电路 。 
图 3-7 显 示 了 用 非 门 、 与 门 和 或 门 实现 的 
这 个 设计 例子 。 这 并 不 是 唯一 的 设计 方 
案 ， 它 只 是 一 个 方便 的 展示 硬件 设计 的 
例子 。3 个 输入 信号 并 排 显示 于 图 中 的 
左上 角 ， 对 每 个 输入 我 们 都 加 了 一 个 非 
门 ， 这 样 我 们 在 电路 设计 中 使 用 这 个 变 
量 本 身 以 及 它 的 补 信号 都 很 方便 。 

同时 注意 图 中 我 们 用 一 个 实心 黑 
点 指明 在 那个 地 方 两 根 线 物理 上 连接 
在 了 一 起 。 我 们 这 样 做 是 为 了 区 分 出 
两 根 连 在 一 起 的 线 和 两 根 相互 交叉 但 
并 未 连 在 一 起 的 线 ， 这 个 黑 点 标记 起 
到 了 这 个 作用 。 

图 3-7 中 的 电路 也 显示 了 输入 变量 、 
它们 的 补 、 用 与 门 实现 的 组 合 项 ,以 及 ” 图 3-6 对 一 个 含有 两 个 输出 变量 的 4- 变 量 真 值 表 进行 简化 
用 或 门 实现 的 这 些 组 合 项 的 并 。 注意 我 们 需要 三 个 2- 输 入 与 门 和 一 个 3- 输 入 或 门 来 实现 这 个 设计 。 
如 果 遇 到 一 个 更 复杂 的 问题 ， 我 们 可 能 需要 选用 带 更 多 输入 变量 的 与 门 和 或 门 ， 或 者 每 个 门 的 输入 
变量 较 少 但 用 好 几 级 门 排列 起 来 。 比 如 说 ， 我 们 可 以 用 三 个 3 输入 与 门 实现 出 一 个 等 效 的 7- 输 入 与 门 。 














输出 变量 X 的 K 图 
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简化 后 的 方程 
X = A*D + A*B*C 
Y = C*D + A*B*D + A*B*C*D 





图 3-7 逻辑 方程 X=B*C+A*B+A*C 的 电路 实现 


图 3-7 中 的 电路 真 的 符合 我 们 用 真 值 表 表 示 的 原始 设计 吗 ? 快速 地 检查 一 下 可 能 是 个 好 主 
意 , 这 样 在 面 对 更 复杂 的 问题 时 我 们 会 对 已 使 用 的 方法 有 信心 。 先 对 真 值 表 的 前 3 项 进行 检查 ， 
剩 下 的 5 项 检查 留 给 你 作为 练习 。 . 

1. 第 1 项 : A =0,B =0,C =0。 非 门将 输入 变量 B 和 C 求 反 ， 使 得 到 达 第 一 个 与 门 的 B 信 号 
和 C 信 号 均 为 1。 既 然 两 个 输入 都 是 “1”， 这 个 与 门 的 输出 也 为 “1”。 这 个 与 门 的 输出 是 或 门 
的 输入 ， 而 或 门 有 一 个 输入 为 “1”， 所 以 其 输出 就 也 是 “1”， 即 x = 1， 这 正 是 真 值 表 所 需要 
的 结果 。 

2. 第 2 项 : A=1,B =0,C=0。 根 据 真 值 表 ， 在 这 个 情况 下 “x” 也 应 为 “1”。 由 于 第 一 
个 与 门 不 需要 变量 A 作 为 输入 ， 而 且 变量 B 和 C 并 没有 变化 ， 所 以 与 上 面 的 情况 1 一 样 ， 我 们 也 
得 到 x = 1。 

3. 第 3 项 : A=0,B=1,C=0。 由 于 B = 1 的 补 是 B=0， 所 以 第 一 个 与 门 现在 得 出 的 结果 
为 “0”"， 即 0 AND 1 = 0。 第 二 个 与 门 以 A 和 B 作 为 它 的 输入 ， 由 于 此 时 A = 0 且 B= 0， 所 以 
它 的 输出 也 是 “0”。 第 三 个 与 门 的 输入 是 A = 0 和 C= 1， 它 的 输出 结果 还 是 “0”。 因 为 或 门 
的 三 个 输入 都 是 “0”， 所 以 最 后 x = 0。 

在 我 们 结束 有 关 逻 辑 门 的 讨论 并 开始 考虑 依赖 于 同步 或 时 钟 信号 的 系统 之 前 ， 让 我 们 看 
看 还 有 什么 其 他 的 数字 系统 需要 我 们 建造 。 真 值 表 的 形式 非常 有 趣 ， 因 为 它 看 上 去 非常 像 一 
个 存储 器 的 组 织 形式 。 图 3-8 就 是 图 3-3 中 的 真 值 表 ， 但 我 们 将 它 显 示 为 一 个 存储 器 的 样子 。 这 
里 有 4 个 输入 变量 和 两 个 输出 变量 。 


32 位 存储 器 
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图 3-8 将 一 个 真 值 表 转 换 为 一 个 存储 器 映像 。 独 立 变量 A 到 D 提 供 了 存储 器 的 地 址 ， 
两 个 输出 变量 E 和 F 的 值 则 用 相应 地 址 ( 真 值 表 的 行 ) 存储 单元 中 的 数据 表示 


让 我 们 看 看 这 样 做 的 含义 。 我 们 可 以 想像 正在 使 用 一 个 真正 的 存储 器 ， 并 将 数据 填充 进 
去 ， 这 样 ， 当 我 们 给 它 合适 的 地 址 位 值 (这 个 例子 中 是 输入 变量 A 到 D 的 组 合 ) 时 ， 从 存储 器 
得 到 的 输出 数据 (变量 E 和 F) 就 正好 符合 我 们 用 真 值 表 定义 的 电路 功能 。 因 此 我 们 有 两 种 方 
式 实 现 罗 辑 系统 ， 或 者 用 逻辑 门 进行 电子 电路 设计 ， 或 者 用 存储 器 设备 直接 实现 真 值 表 的 内 
容 。 若 用 存储 器 实现 逻辑 功能 ， 我 们 就 不 用 像 用 门 电路 进行 设计 那样 再 做 逻辑 简化 。 当 然 ， 
我 们 可 能 得 不 到 我 们 用 其 他 方法 时 所 需 的 速度 。 

为 更 清楚 地 说 明 这 点 ， 我 们 重新 把 图 3-8 画 成 图 3-9， 它 们 唯一 的 区 别 是 我 们 将 把 它 表 示 成 
了 一 个 真正 的 存储 器 。 独 立 变量 (图 3-3 中 的 A 到 D) 被 表示 为 存储 器 的 地 址 位 A0-A3。 输 出 
变量 (图 3-3 的 E 和 F) 现在 是 存在 于 各 个 存储 器 单元 中 的 数据 位 。 

因此 ， 我 们 的 存储 器 总 共 需 要 有 32 位 的 容量 ， 两 个 输出 变量 中 的 每 个 需要 16 位 。 每 个 二 
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进 制 位 表示 组 成 存储 器 单元 地 址 的 输入 变量 组 合 所 对 应 的 输出 变量 值 。 


0000 
0001 
0010 
A0 一 一 基 0011 
0100 
0101 
0110 
0111 
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1001 
1010 
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1100 
i1101 
1110 
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图 3-9 将 一 个 真 值 表 转 化 为 存储 映像 。 独 立 变量 A 到 D 提 供 存储 器 的 地 址 ， 两 个 输出 
变量 E 和 F 用 对 应 存储 器 地 址 ( 真 值 表 的 行 ) 上 存储 单元 中 的 数据 表示 


图 3-8 和 图 3-9 表 示 了 用 硬件 实现 逻辑 设计 的 另 一 种 方式 。 在 前 一 个 例子 中 ， 我 们 用 布尔 代 
数 定律 和 K 图 建立 了 一 组 简化 的 逻辑 方程 ， 然 后 我 们 可 以 将 它 实现 为 逻辑 门 的 组 合 (也 称 为 组 
合 逻 辑 ，combinatorial logic)。 图 3-8 表 明 我 们 可 以 简单 地 根据 真 值 表 将 其 中 所 有 信息 填 入 一 
个 存储 器 芯片 。 事 实证 明 这 两 种 方法 都 同样 有 效 ， 可 被 用 于 最 适合 它们 的 场合 。 将 存储 器 用 
作 有 逻辑 元 件 ， 称 为 微 编码 (microcode)， 是 现代 数字 计算 机 中 很 多 控制 电路 的 基础 。 当 我 们 
在 后 面 的 章节 中 介绍 状态 机 (state machine) 时 还 会 再 讨论 这 个 概念 。 


3.4 时 钟 和 脉冲 

在 第 2 章 中 ， 我 们 首次 看 到 数字 信号 被 表示 为 波形 。 也 就 是 说 ， 罗 辑 信号 被 表示 为 随时 间 
变化 的 一 系列 值 ， 而 波形 则 是 这 种 信号 显示 在 条 带 记 录 纸 上 的 图 形 。 我 们 需要 考虑 的 最 简单 
的 数字 信号 是 图 3-10 所 示 的 简单 正 脉冲 ， 图 中 显示 的 是 一 个 脉冲 高 度 约 为 3V 的 单个 正 脉冲 。 


Le 


脉冲 宽度 


电压 (伏特 ) 


已 


时 间 〈 纳 秒 ) 
图 3-10 一 个 大 约 3V 高 的 正 脉 冲 的 典型 波形 
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到 这 里 我 们 要 停 一 下 ， 然 后 问 :“ 什 么 是 脉冲 ? ”你 可 能 知道 的 一 个 医学 术语 是 你 的 “ 脉 
搏 ”( 它 和 脉冲 的 英文 同 为 “pluse" ) ， 它 表示 每 次 你 心跳 时 你 能 感觉 到 的 血管 压力 的 变化 。 由 
于 心脏 对 血液 的 挤 压 是 不 连续 的 ， 会 造成 离散 的 血管 跳动 ， 所 以 你 感觉 到 的 是 血液 流动 时 产 
生 的 压力 脉动 。 当 你 进行 心脏 检查 时 ， 从 得 到 的 心电图 上 也 能 看 到 这 种 东西 ， 在 心脏 电信 号 
的 特征 曲线 上 你 会 看 到 一 个 个 尖峰 (图 3-11)。 

任何 一 个 脉冲 的 特点 都 是 系统 从 一 个 松弛 
的 状态 (比如 低压 ) 变 到 一 个 激动 的 状态 ( 血 
















液 凡 洲 )， 然 后 再 回 到 松弛 状态 。 电 学 上 ， 我 上 让 

们 可 以 将 脉冲 描述 为 从 低 电 压 到 高 电压 ， 然 后 EH 

再 回 到 低 电压 (或 者 完全 相反 的 过 程 ) 的 一 个 WT Tr 1 本 中 

电信 号 。 换 名 话说 ,一 个 脉冲 可 以 是 这 样 的 一 TT rr 

个 系统 ， 它 从 有 效 状态 进入 到 无 效 状态 ， 再 回 i 时 周 村 HH 村 EH 
| 


HH 一 HHHEH HH 一 HH 


到 有 效 状 态 。 我 们 称 从 低 电 压 到 高 电压 再 回 到 
低 电 压 的 脉冲 为 正 脉 冲 (positive pulse) ， 而 从 
高 电压 到 低 电压 再 回 到 高 电压 的 脉冲 为 负 脉 冲 





(negative pulse ) 。 图 3-11 心电图 的 一 部 分 ， 它 显示 了 心 驻 处 电 
图 3-10 中 的 脉冲 是 正 脉冲 ， 因 为 它 从 “ 低 ” 信号 的 特征 脉冲 


状态 进入 “高 ”状态 ， 结 束 的 时 候 又 回 到 了 “ 低 ” 状 态 。 在 这 个 例子 中 ， 脉 冲 宽度 (pulse 
width) 是 对 脉冲 存在 时 间 的 度量 ， 既 然 对 这 个 脉冲 没有 给 出 时 间 刻 度 〈x 坐 标 轴 ) ， 我 们 假设 
脉冲 宽度 约 为 50ns (经 常 被 简写 为 50ns)， 即 50 个 十 亿 分 之 一 秒 。 脉 冲 宽度 是 在 脉冲 的 低压 和 
高 压 之 间 的 中 点 处 的 测量 值 。 因 此 ， 对 于 3V 高 度 的 脉冲 ， 我 们 在 1.5SV 处 测量 波形 的 脉冲 宽度 。 

图 3-12 或 多 或 少 显示 了 一 个 “真实 的 脉冲 ”"。 所 谓 真实 的 脉冲 ， 是 指 如 果 你 拿 着 一 个 非常 
快 的 秒表 和 一 个 反应 极 快 的 伏特 计 ， 并 且 能 够 像 发 疯 了 那样 快速 涂写 (注意 这 是 一 个 理想 实 
验 ) ， 你 所 能 看 到 的 。 在 真实 生活 中 ， 人 们 用 一 种 称 为 示波器 〈oscilloscope) 的 分 析 仪器 观看 
这 种 波形 。 我 们 在 本 章 后 面 会 看 到 一 些 真 实 的 示波器 波形 。 注 意图 3-12 中 代表 时 变 脉冲 电压 
的 灰 线 在 上 升 和 下 降 时 都 存在 一 个 坡度 ， 这 是 由 于 脉冲 状态 不 能 以 无 穷 快 的 速度 进行 改变 ， 
电压 升 到 1 和 降 为 0 都 需要 经 历 一 些 时 间 ， 我 们 称 这 些 时 间 分 别 为 上 升 时 间 (rise time) 和 下 降 
时 间 (fall time)。 从 技术 上 讲 ， 由 于 我 们 不 需要 考虑 的 原因 ， 上 升 和 下 降 时 间 测 量 的 都 是 
10% 电 压 点 和 90% 电 压 点 之 间 的 时 间 。 


| | 1 二 
时 间 ( 纳 秒 ) 
图 3-12 示波器 上 显示 的 正和 脉冲 的 样子 
图 3-12 是 脉冲 波形 在 示波器 屏幕 上 看 到 的 大 致 样子 ， 水 平 轴 代 表 以 某 种 合适 的 单位 (在 
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这 个 例子 中 是 ns) 表示 的 时 间 ， 垂 直 轴 显示 电压 信号 如 何 随时 间 改 变 。 

图 3-13 显 示 了 用 一 个 研发 实验 室 中 真实 示波器 进行 上 升 时 间 测 量 的 图 像 。 示 波 器 能 自动 
测量 一 些 量 ， 比 如 上 升 时 间 、 下 降 时 间 、 脉 冲 宽度 、 脉 冲 高 度 、 频 率 和 周期 等 。 示 波 器 中 的 
电路 会 自动 分 析 脉 冲 波形 的 形状 ， 定 位 10% 电 压 点 和 90% 电 压 点 ， 然 后 计算 出 这 两 点 之 间 的 时 
间 差 。 





图 3-13 用 示波器 测量 上 升 时 间 。 垂 直 轴 上 每 格 是 1V， 水 平 轴 上 每 格 是 10 纳 秒 


在 我 们 进一步 开始 考虑 时 钟 之 前 ， 我 们 应 该 讨论 关于 门 的 最 后 一 点 。 我 们 以 前 定义 了 门 的 
传输 延迟 为 从 输入 状态 改变 到 相应 的 输出 改变 的 时 间 延 迟 ， 让 我 们 看 看 在 示波器 上 一 个 真实 的 
传输 延迟 看 上 去 会 是 什么 样子 。 图 3-14 显 示 了 对 一 个 非 门 进行 传输 延迟 测量 时 看 到 的 景象 。 如 
图 所 示 ， 我 们 将 示波器 的 探 针 连 到 非 门 的 输入 端 和 输出 端 。 为 了 进行 测量 ， 我 们 在 门 的 输入 信 
号 (这 里 是 下 降 边 ) 到 达 前 一 段 时 间 就 开始 用 示波器 进行 跟踪 。 示 波 器 能 同时 显示 输入 和 输出 
波形 的 逻辑 状态 ， 所 以 我 们 能 看 到 输入 信号 变 低 ， 稍 过 一 会 儿 输 出 信号 变 高 。 事 实 上 ， 如 果 凑 
近 示波器 显示 屏幕 ， 你 会 看 到 输入 信号 下 降 沿 和 输出 信号 上 升 沿 之 间 的 时 间 间 隔 是 12.60ns。 





图 3-14 用 示波器 进行 传输 延迟 的 测量 。 上 面 的 轨迹 线 表示 非 门 输入 端的 测量 结果 ， 下 面 的 轨迹 线 则 代表 
输出 端 。 从 示波器 显示 屏幕 上 可 以 看 出 ， 输 入 信号 变 低 12.60 纳 秒 后 输出 信号 变 高 


到 目前 为 止 ， 我 们 都 把 脉冲 看 成 单个 的 事件 。 但 是 ， 就 像 心电图 中 显示 的 那样 ， 心 脏 是 
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连续 跳动 的 ， 所 以 心电图 曲线 上 是 一 系列 的 脉冲 波形 。 
在 图 3-15 中 ， 我 们 又 回 到 理想 的 波形 图 ， 注 意 这 个 波形 中 的 上 升 沿 和 下 降 沿 都 没有 任何 
的 倾斜 。 我 们 假定 这 些 脉冲 以 无 限 快 的 速度 从 低 电 压 切换 到 高 电压 ， 同 样 以 无 限 快 的 速度 由 
高 电压 变 为 低 电压 。 这 样 的 假设 不 妨碍 正确 的 理解 ， 而 且 让 我 们 更 容易 分 析 清 楚 这 个 图 表 。 
波形 A: 占 空 度 = 50% 
tpn 
4 一 tp 


波形 B， 占 空 度 < 50% 
toe 


图 3-15 时 钟 波形 的 例子 。 当 波形 中 高 电压 部 分 的 宽度 等 于 低 电压 部 分 的 宽度 时 (波形 A)， 我 们 有 50% 
的 占 空 度 。 波 形 B 的 占 空 度 低 于 50%。 波 形 B 中 两 个 黑 点 之 间 的 时 间 间 隔 为 一 个 周期 


我 们 称 图 3-15 所 示 的 这 样 一 串 连 续 的 脉冲 为 时 钟 (clock)， 这 个 时 钟 不 是 指 计算 机 上 显示 
一 天 中 时 间 的 那个 时 钟 ， 这 里 我 们 讨论 的 时 钟 是 经 过 严格 调整 的 一 串 连 续 的 脉冲 信号 ， 它 通 
常 由 晶体 振荡 器 控制 。 晶 体 有 一 种 特性 ， 即 能 够 产生 出 一 种 调制 电路 并 以 一 个 可 预见 且 稳 定 
的 频率 共振 。 例 如 ， 哪 怕 是 最 便宜 的 电子 手表 都 能 准 到 一 个 月 误差 不 超过 一 分 钟 ， 因 为 它 内 
部 使 用 了 大 约 以 32KHz 频 率 震 荡 的 一 种 晶体 。 我 们 用 术语 赫 交 (Hertz) 来 表示 每 秒 发 生 的 周 
期 数 ， 或 一 个 时 钟 信 号 的 震荡 频率 ， 它 对 应 的 符号 是 Hz。 频 率 的 单位 赫兹 的 命名 是 为 了 纪念 
德国 科学 家 Heinrich Rudolf Hertz (1857 一 1894) 。 

时 钟 信号 和 波形 的 细节 很 容易 让 人 糊涂 ， 还 是 让 我 们 就 此 打住 ， 想 想 这 样 一 个 问题 “时 
钟 到 底 是 什么 呢 ? ” 

时 钟 是 一 串 固定 的 脉冲 ， 它 们 通常 有 相当 准确 不 变 的 间隔 。 哪 怕 是 一 个 不 贵 的 电子 手表 
走 一 个 月 的 误差 也 就 只 有 几 秒 或 几 十 秒 。 考 虑 到 它 的 脉冲 在 每 秒 钟 要 震荡 32 000 多 次 ， 脉 冲 
间隔 的 准确 性 就 很 让 人 印象 深刻 了 。 为 了 不 得 罪 电子 工程 师 ， 我 们 不 会 花 时 间 来 讨论 这 么 准 
确 的 时 间 信 号 是 怎样 得 到 的 ， 但 我 们 将 尽力 理解 时 钟 在 我 们 的 系统 中 起 何 种 作用 。 

假设 你 正在 观察 一 个 老 旧 的 钟 的 钟 摆 ， 而 且 你 可 以 在 钟 摆 在 一 端 停 住 时 按 下 秒表 ， 而 当 
它 运动 到 另 一 端 再 回来 时 停止 秒表 ， 你 就 可 以 量 出 这 个 钟 押 的 周期 。 这 种 老式 的 钟 就 是 根据 
钟 摆 的 周期 变化 非常 小 的 事实 ， 再 通过 齿轮 的 机 械 装置 来 驱动 时 钟 的 。 这 里 重要 的 一 点 是 ， 
实际 生活 中 的 钟 摆 提供 了 一 个 准确 的 同步 机 制 ， 使 得 我 们 能 用 它 来 驱动 时 钟 的 内 部 计时 装置 。 
钟 摆 的 运动 也 为 整个 时 钟 提 供 了 同步 的 来 源 ， 每 次 它 来 回 摆动 ， 它 都 带动 齿轮 从 而 报告 时 间 。 

假设 需要 5 秒 钟 让 钟 摆 从 一 端 摆 到 另 一 端 再 摆 回 来 ， 每 5 秒 是 一 个 循环 ， 那 么 周期 就 是 5 秒 ， 
而 一 秒 钟 内 循环 的 次 数 就 是 周期 的 倒数 ， 即 0.2Hz。 

在 我 们 的 数字 系统 中 ， 我 们 用 时 钟 信号 来 提供 相同 的 同步 机 制 。 在 大 多 数 计算 机 系统 里 ， 
一 个 单独 的 时 钟 信 号 分 布 于 整个 电路 中 ， 它 为 所 有 需要 同步 的 内 部 操作 提供 了 一 个 准确 的 时 
间 源 。 当 你 去 当地 的 计算 机 商店 去 买 最 新 出 品 的 个 人 电脑 时 ， 销 售 人 员 会 尽力 说 服 你 购买 带 
有 3.2 吉 赫兹 时 钟 的 电脑 ， 以 使 你 获得 最 佳 的 游戏 体验 。 真 正 卖 给 你 的 是 什么 呢 ? 其 实 就 是 一 
个 有 更 快 时 钟 的 高 级 电脑 ， 其 意义 在 于 一 秒 钟 内 可 以 发 生 更 多 的 事情 ， 所 以 它 运行 更 快 。 
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如 果 你 买 过 电脑 ， 就 可 能 已 经 对 术语 “赫兹 ”或 其 简写 “Hz” 很 熟悉 了。 销售 人 员 会 告诉 你 
这 台电 脑 或 那 台 电脑 是 3.0“ 吉 赫兹 ”的 机 器 ， 而 它 显然 比 你 那 台 500“ 兆 赫兹 ”的 老 电脑 好 得 多 。 
你 现在 就 理解 了 ， 你 的 旧 电 脑 每 秒 运行 300 个 百 万 周期 ， 即 其 时 钟 频率 是 500 MHz。 这 个 花 上 
1000 美 元 就 能 搬 进 你 车 里 的 电脑 每 秒 运行 30 亿 个 周期 ， 即 其 时 钟 频率 为 3 GHz。 由 于 10 亿 是 1000 
个 百 万 ， 这 也 就 等 于 说 新 电脑 的 时 钟 周期 为 3000 MHz， 或 者 说 大 约 是 旧 电脑 时 钟 速度 的 6 倍 。 

我 们 打算 用 图 3-16 展 示 什么 呢 ? 让 我 们 想像 一 下 我 们 坐 在 一 个 典型 的 计算 机 或 微 处 理 器 
的 时 钟 信号 上 。 你 有 一 个 足够 快 的 Radio Shack 牌 伏特 计 ， 并 且 正 在 测量 时 钟 输入 的 电压 ( 逻 
辑 电 平 ) 。 时 钟 电压 开始 为 低 (逻辑 电 平 0) ， 过 一 会 儿 后 变 高 (逻辑 电 平 1) ， 过 一 会 儿 再 变 低 ， 
一 直 这 样 循 环 下 去 。 每 个 低 电压 保持 的 时 间 和 以 前 的 完全 一 样 ， 每 个 高 电压 保持 的 时 间 也 和 
其 他 的 一 样 。 从 低 到 高 、 从 高 到 低 的 切换 时 间 很 快 ， 也 不 随时 间 变 化 。 因 此 ， 一 个 完整 循环 
(由 低 到 高 再 回 到 低 ) 的 时 间 周 期 是 完全 可 重复 的 。 
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图 3-16 一 个 2.5MHz 时 钟 的 震荡 图 像 。 垂 直方 向 每 格 代表 1 伏 ， 水 平方 向 每 格 代表 100 纳 秒 。 注 意 ， 
只 要 信号 电压 超过 逻辑 1 的 闪 值 电压 或 者 低 于 逻辑 0 的 阔 值 ， 就 能 发 挥 正确 的 功能 


图 3-16 是 一 个 2.5 MHz 时 钟 信 号 的 实际 震荡 波形 。 注 意图 中 的 时 钟 波形 不 如 我 们 理想 的 波 
形 那 么 “整洁 ”， 当 然 也 差 得 不 远 。 在 这 个 图 中 可 以 清楚 地 看 到 上 升 沿 和 下 降 沿 ， 通 过 看 这 个 
图 我 们 可 以 上 一 堂 有 价值 的 课 。 虽 然 这 个 时 钟 波形 不 如 理想 波形 那么 漂亮 ， 但 它 能 正确 地 在 
电路 中 工作 ， 原 因 很 简单 ， 因 为 数字 世界 中 只 有 1 和 0， 其 他 的 都 不 重要 。 只 要 信号 的 电压 低 
于 信号 0 的 疼 值 或 高 于 信号 1 的 阐 值 ， 它 就 能 被 正确 地 理解 。 

让 我 们 给 出 一 些 术语 的 定义 : 

。 频率 : 单位 时 间 (通常 为 1 秒 ) 内 时 钟 脉冲 的 数目 。 频 率 的 度量 单位 是 赫兹 ， 或 写作 Hz。 

1 Hz 等 同 于 每 秒 一 个 时 钟 周期 。 

。 周 期 : 频率 的 倒数 ， 它 是 相 邻 脉冲 波形 上 两 相同 位 置 点 之 间 的 时 间 间 隔 。 图 3-15 中 波形 
B 上 两 个 黑 点 之 间 的 时 间 t。ya。 代 表 波形 的 周期 或 者 一 个 波 循环 的 时 间 。 时 钟 频 率 等 于 
周期 的 倒数 ， 一 个 周期 为 1 秒 的 时 钟 波形 其 频率 为 1Hz。 

。 占 空 度 : 时 钟 信号 电压 为 高 的 时 间 占 整个 周期 的 比例 。50% 的 占 空 度 意味 着 时 钟 信号 在 

正好 半 个 周期 的 时 间 内 为 高 ， 或 者 时 钟 信号 为 高 的 时 间 等 于 时 钟 信号 为 低 的 时 间 。 我 们 
也 可 以 用 公式 来 计算 : 占 空 度 = (tea / (tp +tpD)) x 100% 。 

图 3-17 显 示 了 常用 (计算 机 这 个 领域 ) 的 时 间 单 位 之 间 的 关系 ， 以 及 常用 的 频率 单位 之 

间 的 关系 。 
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从 图 3-17 也 可 以 看 出 ， 频 率 是 1 MHz 的 时 钟 其 周期 为 1ns ( 微 秒 ) ， 而 频率 是 1GHz 的 时 钟 
其 周期 为 lns ( 纳 秒 ) 。 因 此 ， 你 的 装 有 1 GHz poo 
Athlon 品 牌 CPU 的 计算 机 有 一 个 震荡 极 快 的 时 下 
钟 ， 在 它 的 一 个 周期 时 间 内 光 也 只 能 走 大 约 1 英 
尺 的 距离 。 

让 我 们 复习 一 些 有 用 的 关系 : 

。 1lns 的 时 钟 周期 ， 其 频率 为 1GHz。 

。1MHz 的 时 钟 频 率 ， 其 周期 为 1us ( 微 











秒 )。 
lms (上 毫秒) 的 时 钟 周期 ， 其 频率 为 
1KHz。 
。1 秒 的 时 钟 周期 ， 其 频率 为 1Hz。 : 
总 结 图 3-17 时 间 和 频率 的 常用 单位 。 空 气 中 光 的 速度 
非常 接近 于 每 纳 秒 1 英尺 ， 而 光 在 集成 电 
。 布尔 代 数 提供 了 处 理 和 简化 逻辑 方程 的 路 心 片 中 一 条 通路 中 的 速度 约 为 空气 中 的 
规则 。 一 半 ， 大 约 是 每 纳 秒 6 英寸 
“根据 所 有 可 能 的 输入 变量 状态 以 及 相应 的 输出 变量 状态 ， 真 值 表 提供 了 一 种 描述 任意 
数字 系统 的 有 效 办 法 。 


。 卡 诺 图 是 对 真 值 表 得 到 的 最 小 项 形式 逻辑 表达 式 进行 简化 的 图 形 化 方法 。 

。 数字 系统 由 时 钟 信号 驱动 ， 时 钟 信号 是 一 串 连 续 的 脉冲 ， 这 些 脉冲 可 以 由 它们 的 宽度 、 
高 度 、 上 升 时 间 和 下 降 时 间 来 描述 。 

。 频 率 和 周期 之 间 是 互 为 倒数 的 关系 。 

。 我 们 用 工程 数字 单位 系统 来 描述 在 数字 系统 设计 中 常用 到 的 频率 和 时 间 量 。 
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习题 


1. 设计 一 个 1 位 全 加 法 电路 。 其 中 全 加 法 器 能 将 两 个 输入 二 进 制 位 和 一 个 进位 位 相 加 ， 输出 
它们 的 和 及 进位 值 。 参 考 下 图 ， 创 建 真 值 表 、 卡 诺 图 、 简 化 的 布尔 方程 以 及 一 个 门 级 的 电 
路 图 。 

2. 使 用 真 值 表 证 明 德 . 摩根 定理 中 的 两 种 情况 。 

3. 下 图 中 显示 的 电路 称 为 环形 震荡 器 (Ring Oscillator)， 


A 
它 包括 5 个 非 门 首尾 相连 。 想 像 你 正在 测量 A 点 处 的 电 。 全 加 和 
压 电 平 。 经 过 每 个 门 的 传输 延迟 都 正好 是 10ns， 传 输 人 进位 输出 


延迟 的 定义 是 门 的 输入 变化 引起 门 输出 变化 的 间隔 时 ”过 位 输入 





~ 
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个 
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间 。 假 设 时 间 t= 0ns 时 A 点 的 电压 从 0 变 到 1。 
a. 画 出 A 点 处 波形 的 草图 。 

b. 这 个 电路 的 震荡 周期 是 多 少 ? 

c. 这 个 电路 的 震荡 频率 是 多 少 ? 


.设计 一 个 有 4 个 地 址 输入 A、B、C、D 和 1 个 输出 x 的 真 值 表 。 假 设 A 和 B 是 控制 端 输入 ，C 和 


D 是 任意 的 输入 变量 。 在 真 值 表 中 填 入 x 的 值 ， 使 得 电路 根据 控制 输入 A 和 B 的 状态 实现 不 同 
的 逻辑 功能 。 这 些 逻 辑 功 能 显示 在 下 表 中 : 


A B 关于 C 和 D 的 输出 逻辑 函数 输出 x) 
0 0 与 非 (NAND) 

0 1 异 或 (XOR) 

1 0 或 非 (NOR) 

1 1 与 (AND) 


.优先 权 编 码 器 (Priority Encoder) 是 一 个 电路 ， 它 的 输出 是 开启 的 最 高 有 效 输入 位 所 对 应 


的 二 进 制 码 。 假 设 有 如 下 图 所 示 的 一 个 电路 图 ， 其 中 A 是 
输入 的 最 低 有 效 位 ， 而 DD 是 输入 的 最 高 有 效 位 。X 是 输出 
的 最 低 有 效 位 〈2 ) ， 而 Z 是 输出 的 最 高 有 效 位 〈22) 。 如 
果 所 有 的 输入 都 为 0， 则 所 有 的 输出 都 为 0(。 输 出 的 优先 级 
别 由 值 为 1 的 输入 的 最 高 有 效 位 决定 。 为 这 个 电路 创建 真 
值 表 ， 然 后 使 用 卡 诺 图 简化 真 值 表 并 画 出 简化 的 电路 。 


优先 权 Y 
编码 器 z 


DOmWP 


. 假设 一 个 逻辑 电路 ， 其 输入 为 两 个 4 位 二 进 制 数 (A0 到 A3， 以 及 B0 到 B3) ， 而 输出 为 1 位 


二 进 制 数 Z。 当 两 个 输入 的 数 相等 时 输出 Z 为 真 〈 高 电压 ) 。 设 计 这 个 电路 实现 等 价 性 检测 
功能 。 


.假设 你 是 “天 堂 之 路 ”(Road to Nirvana) 泡 澡 和 温泉 公司 的 首席 设计 师 ， 给 你 的 任务 是 设 


计 一 个 新 的 温泉 控制 器 来 代替 那个 根据 1972 年 的 洗衣 机 而 改造 的 老 控制 器 。 下 面 是 具体 的 


变量 值 =0 变量 值 =1 
温度 指示 器 :A 水 温 低 于 期 望 的 泡 澡 温 度 水 温 等 于 或 高 于 理想 的 泡 澡 温度 
日 常 过 滤 计 时 开关 : B 流通 泵 关闭 流通 泵 打开 
吹风 机 开关 : D 吹风 机 关闭 吹风 机 打开 
钥匙 开关 : EE 系统 关闭 系统 启动 
手动 泵 开关 : F 流通 泵 关闭 流通 泵 打开 


你 的 逻辑 电路 要 控制 下 面 的 输出 信号 : 
代表 泵 的 马达 ， 值 为 1 代表 开 。 

8 代表 歇 风机 : 值 为 1 代表 开 。 

h 代 表 加 热 器 : 值 为 1 代表 开 。 
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参考 下 图 ， 具 体 的 工作 流程 是 : 

a. 为 这 个 泡 澡 控制 器 创建 真 值 表 ， 注 意 可 能 有 多 种 不 同 的 方式 定义 澡 盆 的 操作 。 
b. 用 卡 诺 图 、 德 ， 摩根 定理 和 布尔 代数 关系 式 来 简化 你 的 逻辑 方程 。 

c. 当 你 尽 可 能 地 简化 了 这 些 方程 后 ， 用 门 电路 画 出 这 个 逻辑 设计 。 





8. 下 面 是 一 个 称 为 3- 输 入 8- 输 出 译 码 器 的 真 值 表 。 基 于 输入 变量 的 二 进 制 值 ( 从 0 到 7)， 它 每 
次 只 将 一 个 输出 置 为 低 有 效 ， 根 据 真 值 表 也 可 以 看 出 这 一 点 。 使 用 你 学 过 的 布尔 代数 推导 
方法 和 卡 诺 图 技术 ， 画 出 能 实现 这 个 功能 的 最 简单 的 门 电路 图 。 提 示 : 注意 “输出 的 激活 
状态 ”是 低 ， 而 不 是 高 ， 你 可 以 利用 这 点 大 大 简化 这 个 问题 的 逻辑 表达 式 。 注 意 称 输出 
为 CS0 到 CS7 是 有 原因 的 ， 我 们 将 在 学 习 存 储 器 系统 组 织 时 介绍 它 。 





A0 Al A2 C50 C5I C52 CS3 C54 C55 C56 CS7 
0 0 0 0 1 1 1 1 1 1 1 
1 0 0 1 0 1 1 1 1 1 1 
0 0 1 1 0 1 1 1 1 1 
1 1 0 1 1 1 0 1 1 1 1 
0 0 1 1 1 1 1 0 1 1 1 
1 0 1 1 1 1 1 1 0 1 1 
0 1 1 1 1 1 1 1 1 0 1 
1 1 1 1 1 1 1 1 1 1 0 





9. 假设 按 如 下 命令 定义 了 4 个 变量 A、B、C 和 PD : 
bool A, B, C, DD; 
控制 C 的 语句 为 : 
I£ (D) 
C= B; 
else 


C=A; 


请 画 出 这 个 控制 电路 的 等 效 门 电路 图 。 





面 那个 与 非 门 的 两 个 输入 为 1 和 0， 而 下 面 


第 4 章 同步 逻辑 简介 


学 习 目 标 

。 学习 如 何 连 接 逻 辑 门 得 到 触发 器 电路 ， 

。 学 习 不 同类 别 的 触发 器 和 它们 的 行为 ， 

。 学习 使 用 D 型 触发 器 的 不 同 电路 结构 ， 包 括 分 频 器 、 计 数 器 、 移 位 寄存 器 和 存储 寄存 器 ; 
。 学 习 如 何 用 D 型 触发 器 来 同步 状态 机 的 状态 转换 。 


4.1 引言 


到 有 目前 为 止 ， 我 们 对 数字 逻辑 系统 的 学 习 还 仅 限 于 异步 逻辑 ， 异 步 逻 辑 是 指 “ 不 同步 的 ” 
有 逻辑。 在 我 们 讨论 的 系统 中 ， 这 意味 着 输出 变量 状态 的 改变 仅 依赖 于 输入 变量 的 状态 以 及 连 
接 输 入 和 输出 之 间 的 组 合 逻 辑 。 改 变 一 个 输入 变量 则 输出 变量 也 会 改变 以 保证 逻辑 的 正确 性 ， 
这 个 过 程 中 除了 通过 组 合 逻 辑 门 的 传输 延迟 外 就 没有 其 他 的 延迟 了 。 然 而 ， 在 包含 数 百 万 罗 
辑 门 的 一 台 计 算 机 中 ， 我 们 必须 能 够 通过 某 种 主 控 信 号 (即时 钟 ) 来 同步 逻辑 状态 的 改变 ， 
从 而 使 微 处 理 器 所 做 的 事情 能 按 定义 好 的 状态 序列 进行 下 去 。 因 此 ， 现 在 让 我 们 把 注意 力 投 
向 同步 逻辑 。 

看 图 4-1 所 示 的 电路 结构 。 先 看 上 面 的 电路 ， 注 意 这 些 反 向 门 的 输出 是 怎么 和 另 一 个 门 的 
输入 相连 的 。 这 种 结构 我 们 称 之 为 反馈 (feedback)。 当 麦克 风 被 放 在 正 发 出 大 音量 声音 的 喇 
中 附近 时 ， 你 昕 到 的 尖锐 杂音 就 是 反馈 的 一 个 例子 。 让 我 们 分 析 图 4-1 中 的 电路 ， 它 有 两 个 输 
入 A、B 和 两 个 输出 Q、 Q 。 你 马上 会 看 到 ， 电 路 的 输出 总 是 成 对 互补 出 现 的 ， 但 现在 ， 我 们 
只 是 称 它们 为 R 和 Q 。 

根据 图 4-1， 输 入 A、B 和 输出 Q 都 为 逻 
辑 电 平 “1”， 而 输出 Q 为 逻辑 90。 这 表明 上 


那个 与 非 门 的 输入 都 为 1。 从 与 非 门 的 真 值 
表 可 以 看 出 ， 由 于 两 个 门 的 输入 和 输出 者 
处 于 正确 的 逻辑 状态 ， 所 以 这 个 电路 是 稳 
定 的 。 现 在 ， 我 们 通过 在 输入 端 A 加 一 个 负 0 。 
脉冲 来 给 这 个 系统 一 个 扰动 ， 电 路 的 状态 | 

将 迅速 地 发 生 改 变 。 由 于 输入 是 1 和 0， 下 

面 那 个 与 非 门 的 输出 变 为 1。 现 在 这 个 1 又 。 “1 。 

加 在 上 面 那个 与 非 门 的 输入 端 , 因为 输入 0 一 | 人 一 0 
oh 所 以 它 的 输出 变 为 0。 上 面 与 非 门 图 4.1 RS 触发 器 。 上 面 用 与 非 门 设计 的 电路 由 负 向 及 
9 输出 同时 也 是 下 面 那个 与 非 门 的 输入 ， 的 
这 样 使 得 后 者 的 两 个 输入 均 为 0， 其 输出 自 际 儿 
然 为 1。 最后， 我 们 撒 销 脉冲 让 信号 恢复 到 原来 的 样子 ， 这 样 做 只 是 让 输入 端 A 的 信号 回 到 之 
前 的 状态 。 值 得 注意 的 是 ， 即 使 A 变 为 1， 两 个 与 非 门 的 输出 也 仍然 会 保持 它们 新 的 状态 ,其 


吕 | 





中 | 
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原因 是 来 自 上 面 那个 门 的 正 反馈 信号 迫使 电路 保持 在 8 = 0 和 Q = 1 状态 。 

显而易见 ， 如 果 我 们 在 输入 B 上 加 一 个 负 脉 冲 并 重复 上 面 描 述 的 过 程 ， 那 么 输出 信号 将 翻 
转 回 它们 原来 的 状态 。 对 于 图 4-1 中 或 非 门 组 成 的 电路 ， 你 应 该 可 以 类 似 于 前 面 分 析 与 非 门 电 
路 那样 进行 这 样 的 分 析 。 这 时 ， 导 致 状态 变化 的 将 是 正 脉冲 ， 而 不 是 负 脉 冲 。 


4.2 触发 器 


对 于 图 4-1 中 的 与 非 门 电路 ， 如 果 我 们 在 输入 端 A 第 二 次 加 上 负 脉 冲 ， 那 么 系统 状态 也 不 
会 改变 ， 因 为 上 面 那个 与 非 门 的 输出 仍然 是 90。 让 这 个 电路 回 到 原来 状态 的 唯一 办 法 是 在 输入 
端 B 加 一 个 负 脉 冲 。 因 此 我 们 可 以 看 出 ， 一 个 输入 端 是 置 位 (SET) 输入 ( 置 Q = 1) ， 而 另 一 
个 输入 是 复位 (RESET) 输入 ( 置 Q = 0)。 这 类 电路 元 件 称 为 触发 器 (flip-flop)， 因 为 两 个 
输出 信号 像 游乐 场 里 的 跷 跷 板 那样 一 个 上 ， 另 一 个 必然 下 。 这 里 介绍 的 这 种 触发 器 为 RS 触发 
器 ， 因 为 它 的 两 个 输入 交替 地 使 输出 信号 置 位 (S) 和 复位 (R)。 我 们 也 称 这 种 交替 置 位 和 复 
位 的 现象 为 两 个 状态 之 间 的 都 转 (toggling) ， 这 很 像 房 间 墙 上 的 翻转 开关 控制 着 灯 的 开 和 关 。 
图 4-2 是 将 RS 触发 器 表示 为 一 个 独特 的 电路 元 件 的 示意 图 。 我 们 把 图 4-1 中 的 与 非 门 电 路 和 或 
非 门 电路 搬 过 来 ， 又 画 了 一 个 不 同 的 电路 符号 表示 它 。 

虽然 图 4-2 是 一 个 简单 的 例子 ， 但 B 
它 说 明了 一 个 重要 的 概念 。 从 第 1 章 到 Q 
第 3 章 ， 我 们 考虑 的 电路 越 来 越 复杂 ， 
例如 我 们 学 习 了 如 何 利用 电子 开关 元 件 
即 MOSFET 晶 体 管 构造 配置 一 个 简单 的 ”A 
反 相 器 ， 然 后 又 怎么 将 这 个 基本 的 配置 
扩展 为 更 复杂 的 门 电路 ， 比 如 与 非 门 。 避 
我 们 也 学 习 了 如 何 用 一 个 独特 的 符号 表 
示 复 合 门 ( 异 或 门 )， 以 简化 那些 表示 
它 的 电路 。 现 在 我 们 正在 扩展 这 个 概念 ， A Q 
开始 用 这 个 简单 的 电路 构件 块 创造 新 
的 、 更 强大 的 电路 配置 。 我 们 将 在 本 章 
乃至 本 书 剩 下 的 部 分 继续 这 样 的 过 程 。 
让 我 们 继续 下 去 ! 

RS 触发 器 非常 重要 ， 因 为 它 引 入 了 状态 依赖 (state dependency) 的 概念 。RS 触 发 器 两 个 
输出 端的 状态 不 仅 依赖 于 两 个 输入 变量 A 和 B 的 值 ， 而 且 依赖 于 输出 端的 先前 状态 ， 这 与 我 们 
所 看 到 的 异步 组 合 逻 辑 的 行为 完全 不 同 。 现 在 ， 输 出 的 状态 成 为 了 输入 状态 以 及 输出 先前 状 
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ot 








图 4-2 表示 RS 触发 器 的 独特 的 电路 符号 


态 的 函数 。 即 使 从 一 个 “新 概念 ”的 角度 来 看 RS 触发 器 非常 重要 ， 它 在 实际 中 的 使 用 也 仍 很 ， 


有 限 。 因 此 让 我 们 花 一 些 时 间 来 看 看 如 何 将 这 个 概念 应 用 到 更 实际 的 电路 构造 上 去 。 

RS 触发 器 是 一 个 异步 器 件 ， 给 S 端 或 R 端 输入 加 上 脉冲 信号 将 相应 地 驱动 输出 QR 和 。 当 
输入 信号 激活 后 ， 输 出 就 会 跟着 响应 ， 这 里 不 涉及 时 钟 信号 。 这 样 就 有 一 个 问题 “所 有 这 些 
信号 的 同步 机 制 是 怎样 的 ? ”这 是 个 好 问题 。 这 里 确实 没有 信号 同步 ， 我 们 用 与 非 门 和 或 非 
门 的 门 控 特 性 来 引入 时 钟 的 概念 。 图 4-3 显 示 了 这 样 一 个 触发 器 的 设计 ， 我 们 称 它 为 带 时 钟 的 
RS 触发 器 (clocked RS flip-flop)。 为 了 简单 ， 我 们 仅 使 用 了 与 非 门 ， 采 用 合适 的 替换 你 很 容 
易 将 这 个 电路 用 或 非 门 来 实现 。 
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现在 通过 增加 的 两 个 与 非 门 ， 我 们 就 可 以 用 第 三 个 输入 〈 即 时 钟 信 号 ) 来 控制 R 和 S 的 输 
入 。 而 且 ， 现 在 R 和 S 输 入 信号 是 在 电压 为 高 时 
激活 触发 器 ， 而 不 是 低 时 激活 触发 器 ， 这 是 由 于 
两 个 增加 的 门 的 反 相 作用 。 假 设 现在 Q = 0 和 互 
= 1， 我 们 希望 翻转 触发 器 使 输出 达到 相反 的 状 — 
态 。 假 设 时 钟 输入 为 低 电 压 ， 那 么 将 SET 输入 变 。 时 钟 信号 
成 高 电压 将 不 起 作用 ， 因 为 只 有 当 两 个 输入 同 
时 为 高 电压 时 与 非 门 的 输出 才 会 变 成 低 电压 。 
这 样 ， 当 我 们 将 SET 输入 设 成 高 电压 时 ， 只 有 当 图 4-3 带 时 钟 的 RS 触发 器 
时 钟 信号 也 变 高 时 才能 使 触发 器 的 输出 状态 发 
生 翻转 。 

这 已 经 接近 于 我 们 想 实 现 的 电路 功能 ， 但 还 不 完全 。 我 们 已 经 引入 了 一 个 时 钟 同步 机 
制 ， 但 这 是 一 个 比较 弱 的 同步 。 其 问题 是 ， 这 样 得 到 信和 号 同步 的 程度 依赖 于 实际 时 钟 信号 
的 宽度 。 如 果 时 钟 信号 保持 高 电压 的 时 间 比 R 和 S 输 入 信号 变化 的 时 间 间 隔 大 得 多 ， 那 么 就 
得 不 到 我 们 希望 的 那 种 同步 效果 。 只 要 时 钟 信号 为 高 电压 ， 在 R 和 S 输 入 上 加 脉冲 信号 就 能 
使 输出 信号 不 断 地 发 生 翻转 。 而 理想 的 情况 是 ， 我 们 希望 使 用 时 钟 信号 的 上 升 沿 或 者 下 降 
沿 来 同步 这 些 触发 器 ， 而 不 是 用 时 钟 电位 的 高 低 来 进行 同步 。 记 住 ， 软 辑 信 号 的 上 升 沿 和 
下 降 沿 是 电压 从 低 到 高 和 从 高 到 低 的 切换 过 程 。 为 了 稳定 性 ， 我 们 要 求 这 种 信号 切换 发 生 
得 非常 快 ， 而 与 信号 保持 在 高 电压 或 低 电 压 的 时 间 长 度 无 关 。 因 此 ， 即 使 一 个 信号 的 状态 
每 12 小 时 才 改变 一 次 (一 个 数字 时 钟 的 半天 变化 指示 器 ) ， 我 们 仍 希望 输出 信号 的 切换 在 几 
纳 秒 就 完成 。 

图 4-4 中 的 电路 构造 所 对 应 的 可 能 是 最 著名 的 一 种 触发 器 了 ， 它 被 称 为 JK 触 发 器 (JK flip- 
flop) (或 简写 为 “JK FF”)。 根 据 Null 和 Lobur 的 著作 '，JK 触 发 器 这 个 名 字 是 为 了 纪念 Jack 
Kilby， 这 位 德州 仪器 公司 的 工程 师 是 集成 电路 的 发 明 者 之 一 。 这 个 电路 中 ， 我 们 采用 了 基本 
的 带 时 钟 的 RS 触发 器 ， 并 增加 了 两 个 重要 特性 ; 

1. 在 输出 Q、 豆 与 与 非 门 的 输入 之 
间 加 了 第 二 套 反 馈 回 路 。 

2. 第 二 套 输入 J 和 K 加 在 与 非 门 的 输 
入 上 。 时 钟 信号 

从 概念 上 讲 ， 我 们 所 做 的 就 是 ， 通 
过 将 门 控 与 非 门 (gating NAND) 从 2 
输入 与 非 门 变 成 3 输入 与 非 门 ， 给 电路 
增加 了 额外 的 反馈 路 径 。 然 而 ， 通 过 这 图 4 4 杖 触发 器 
个 过 程 我 们 离 建 造 一 个 按 我 们 希望 的 方式 工作 的 JK 触 发 器 已 经 不 远 了 。 不 幸 的 是 ， 它 还 不 
完全 正确 。 其 中 的 问题 可 以 追溯 到 前 面 那 个 带 时 钟 的 RS 触发 器 ， 信 号 是 根据 时 钟 的 电位 高 
低 而 不 是 边沿 来 同步 的 。 而 我 们 希望 东 触 发 器 能 根据 时 钟 信号 的 边沿 进行 同步 。 表 4-1 是 一 
个 JI 触发 器 的 真 值 表 。 最 后 一 个 条 件 是 IJ = 1 和 K = 1， 它 们 能 在 时 钟 信号 切换 时 使 触发 器 
发 生 翻转 。 不 久 你 就 会 理解 ， 从 很 多 方面 来 看 这 都 是 一 个 理想 的 电路 行为 。 然 而 ， 由 于 我 
们 仍然 受 时 钟 持 续 时 间 的 支配 ， 当 三 个 输入 信号 都 为 高 电压 时 ， 触 发 器 将 处 于 一 个 不 稳定 
的 状态 。 为 了 理解 这 点 ， 可 返回 到 图 4-1， 分 析 当 输入 A 和 B 同 时 变 低 时 电路 所 处 的 状态 ， 
这 种 情况 也 称 为 竞争 条 件 (race condition)， 通 常会 导致 不 稳定 和 不 可 预料 的 电路 操作 。 
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. 表 4-1 水 触发 器 的 真 值 表 
J K 时 钟 信号 切换 后 的 Q 
不 变 
Q=1 
Q=0 
输出 翻转 


下 面 我 们 分 析 电 路 ， 看 看 是 什么 导致 了 这 个 问题 。 假 设 触发 器 处 于 复位 状态 (Q =0，Q= 1)， 
J 和 K 均 为 高 电压 ， 而 时 钟 为 低 电 压 。 由 于 输出 Q 被 连 回 到 上 面 与 非 门 的 三 个 输入 之 一 ， 当 时 钟 
信号 变 为 高 电压 时 ， 所 有 三 个 输入 都 为 高 ， 其 输出 将 变 低 。 这 个 低 的 输出 将 导致 触发 器 中 的 RS 
触发 器 部 分 发 生 翻 转 。 好 ， 到 现在 为 止 ， 这 正 是 我 们 所 希望 的 电路 行为 。 

一 旦 输出 信号 Q 和 Q 翻转 ， 上 面 那个 与 非 门 的 输出 会 再 次 变 为 高 电压 。 然 而 ， 时 钟 信号 仍 
是 高 电压 ， 所 以 下 面 那 个 与 非 门 的 输出 变 低 使 RS 触发 器 回 到 了 原来 的 状态 。 现 在 这 个 电路 可 能 
会 出 现 两 种 状态 ， 都 是 难以 预料 的 : 或 者 输出 Q 和 Q 都 变 高 ， 并 且 只 要 时 钟 信号 是 高 它们 就 一 
直 保 持 高 电压 的 状态 ， 或 者 由 于 竞争 条 件 导 致 的 不 稳定 性 使 得 输出 快速 翻转 。 只 有 仔细 分 析 电 
路 的 传输 延迟 和 切换 条 件 ， 才 能 准确 地 确定 电路 的 行为 。 无 论 如 何 ， 这 都 不 是 我 们 所 希望 的 。 

我 们 所 缺乏 的 是 一 种 将 控制 转移 到 时 钟 边 沿 的 机 制 ， 解 决 的 办 法 是 构造 一 个 有 两 个 串联 
门 控 RS 触 发 器 的 电路 。 图 4-5 中 所 示 的 就 是 我 们 所 需要 的 。 虽 然 这 个 电路 图 看 上 去 有 点 复杂 ， 
但 实际 上 我 们 只 对 图 4-3 和 图 4-4 中 的 基本 电路 构造 做 了 点 小 的 修改 。 我 们 在 图 4-4 中 构造 两 个 
反馈 回路 ， 并 试图 使 这 个 电路 在 ] = K = 1， 并 且 在 时 钟 信号 出 现 正 脉冲 时 发 生 翻 转 ， 别 忘 了 
这 种 电路 结构 的 主要 问题 。 
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图 4-5 主 从 开 触 发 器 


在 图 4-5 中 ,. 通过 增加 一 个 非 门 (第 9 号 门 ) 和 第 二 个 门 控 触 发 器 ， 我 们 解决 了 信号 竞争 
的 问题 。 这 个 新 的 触发 器 设计 称 为 主 从 (master-slave) J 区 触 发 器 。 在 你 开始 仔细 理解 其 中 奥 
妙 之 前 ， 让 我 告诉 你 它 完全 是 好 的 。 第 一 组 电路 元 件 是 “ 主 ” 元 件 ， 用 于 输入 数据 并 让 它们 
稳定 ， 然 后 数据 被 传送 给 “从 ”元 件 ， 最 后 数据 出 现在 Q 和 局 输出 上 。 非 门 和 “从 ”元 件 部 
分 一 起 创造 了 前 面 我 们 所 缺少 的 电路 功能 。 当 主 触 发 器 部 分 ( 门 1 到 门 4) 的 时 钟 信号 变 高 时 ， 
非 门 的 输出 会 变 低 从 而 锁 住 从 触发 器 ， 避 免 了 它 的 RS 触发 器 输出 端的 任何 变化 。 

当时 钟 信 号 再 次 变 低 时 ， 主 触发 器 失效 ， 但 它 的 RS 部 分 不 会 改变 状态 。 然 而 ， 变 低 的 时 
钟 使 得 从 触发 器 有 效 ， 并 且 它 的 改变 与 门 控 输 入 保持 一 致 。 
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由 于 阻止 了 竞争 条 件 的 发 生 ， 以 前 造成 所 有 竞争 问题 的 两 个 反馈 回路 现在 都 能 正确 地 工 
作 了 。 现 在 触发 器 中 的 主 、 从 两 部 分 分 别 在 时 钟 为 高 电压 和 低 电 压 时 (在 交替 相位 上 ) 工作 。 
换 名 话说， 在 原来 的 电路 中 由 于 从 输出 到 输入 的 反馈 信号 只 要 时 钟 为 高 电压 就 可 以 自由 “ 竞 
争 "， 这 导致 了 竞争 问题 。 现 在 ， 我 们 改变 了 电路 使 得 反馈 回路 被 有 效 地 进行 了 隔离 ， 每 个 时 
刻 只 有 一 半 的 电路 处 于 活动 状态 。 这 个 主 从 式 的 电路 配置 最 终 实现 了 我 们 的 目标 ， 它 仅 在 时 
钟 信号 切换 时 工作 ， 而 不 是 在 时 钟 的 某 个 电位 下 工作 。 

图 4-6 中 将 式 主 从 触发 器 表示 为 一 个 独特 的 电路 模块 ， 也 显示 了 其 对 应 的 真 值 表 。 注 意 我 
们 用 一 个 向 下 箭头 指示 在 时 钟 反 向 切换 (由 高 变 低 ) 时 输出 会 改变 状态 ， 这 也 是 主 电路 部 分 
向 从 电路 部 分 传递 信息 的 时 候 。 图 4-6 中 也 显示 了 稍微 修改 了 一 点 的 电路 。 通 过 增加 一 个 非 门 ， 
我 们 限制 了 JK 触 发 器 仅 在 JI = 1 而 K = 0 的 条 件 下 或 者 相反 的 条 件 下 工作 。 这 个 非 门 屏 项 了 其 他 
两 种 可 能 组 合 的 发 生 ， 即 J= 天 = 0 和 J =K=1。 













有 时钟 信号 由 | Q 输 出 ] 
[0lol | 不 变 | 


J 触发 器 被 改造 为 “PD” 型 触发 器 


图 4-6 对 主 从 开 触 发 器 稍微 修改 ， 得 到 “D” 型 触发 器 


这 个 新 的 电路 结构 称 为 D 触 发 器 ， 是 触发 器 家 族 中 最 重要 的 一 员 ， 在 本 书 剩 下 的 部 分 我 们 
将 集中 精力 讨论 这 种 电路 。 

观察 图 4-6 右 下 角 的 D 触 发 器 的 真 值 表 ， 你 会 注意 到 一 个 有 趣 的 现 像 。 当 时 钟 信号 变 低 时 ， 
输出 Q 的 改变 与 输入 DD 完全 一 致 。 换 一 种 说 法 来 描述 这 件 事情 ,“ 在 时 钟 信号 的 下 降 沿 ， 输 入 D 
上 的 数据 被 存储 到 这 个 电路 单元 中 ， 并 且 显 示 于 输出 Q 上 。” 现 在 我 们 知道 为 什么 称 它 为 D 触 
发 器 了 ， 这 个 “D” 是 数据 (data) 的 意思 ， 这 其 实 是 一 个 存储 单元 。 

在 我 们 把 全 部 注意 力 投向 DD 触发 器 (缩写 为 D-FF 或 D-flop) 之 前 ， 我 们 需要 做 一 些 介绍 性 
的 论述 。 前 面 说 过 ， 虽 然 我 们 能 够 用 一 些 基本 的 门 电路 来 表示 更 复杂 的 逻辑 函数 ， 但 这 并 不 
意味 着 复杂 函数 的 实际 设计 就 能 直接 由 这 些 逻 辑 门 电路 得 到 。 了 时刻 记 住 ， 在 大 多 数 情况 下 使 
用 一 些 电路 模块 可 以 降低 设计 的 复杂 程度 。 因 此 ， 我 们 会 经 常 讨论 电路 的 逻辑 实现 ， 而 不 是 
其 实际 实现 。 同 时 ， 我 们 也 会 给 电路 模块 增加 一 些 附 加 功能 ， 或 者 稍微 改变 一 点 电路 功能 。 
如 果 你 翻阅 一 下 数字 逻辑 集成 电路 制造 商 的 数据 手册 ， 你 也 许 会 看 到 某 个 标准 电路 有 三 四 种 
不 同 的 版 本 。 例 如 ， 可 能 有 这 样 的 J 玫 触发 器 ， 它 在 时 钟 信号 的 上 升 沿 改变 状态 ， 而 不 是 下 降 
沿 改变 状态 。 制 造 商 这 么 做 是 为 了 扩大 电路 设计 人 员 对 这 种 部 件 的 需求 量 。 

例如 ,假设 你 公司 提供 的 式 触发 器 仅仅 是 下 降 沿 触发 的 触发 器 ， 而 大 量 的 用 户 不 想 通 过 
在 电路 中 插入 一 个 非 门 来 把 上 时钟 信号 上 升 沿 转 化 为 时 钟 信号 下 降 沿 ， 那 么 这 个 产品 就 不 能 让 
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这 些 顾客 满意 。 他 们 会 涌 向 你 公司 的 市 场 部 ， 极 力 说 服 你 们 需要 在 产品 系列 中 增加 一 款 上 升 
沿 触发 的 区 触发 器 ， 否 则 他 们 会 撤销 订单 ， 转 投 能 满足 他 们 需要 的 其 他 公司 。 

D 触 发 器 是 这 种 情况 的 一 个 极 好 例子 。 现 在 几乎 所 有 的 D 触 发 器 都 是 上 升 沿 触 发 的 器 件 ， 
输入 端 D 上 的 数据 是 在 时 钟 信 号 的 上 升 沿 传递 到 输出 端 QR 的。 另外，RS 输 入 的 最 初 功能 被 保留 
了 下 来 ， 以 提供 对 设备 进行 异步 置 位 和 复位 的 功能 。 我 们 可 以 将 D 触 发 器 的 功能 总 结 为 ， 在 时 
钟 上 升 沿 即将 到 来 时 ， 输 入 端 D 的 逻辑 电位 在 时 钟 信号 由 低 向 高 切换 (上升 沿 ) 时 传递 到 输出 
Q,， 输 出 端 Q 将 一 直 保 持 这 个 信号 ， 直 到 时 钟 输入 的 下 一 个 上 升 沿 。 

图 4-7 显 示 了 D 触 发 器 的 逻辑 功能 。 


置 位 (Q =1) 





to t1 tf tf t4 ts it 1t7 te 1 t10 t11 
复位 (Q=0) 时 序 图 
图 4-7 DD 型 触发 器 。 灰 色 区 域 代表 重复 RS 触发 器 功能 的 电路 部 分 ， 无 阴影 区 域 是 主 从 电路 部 分 ， 
通过 它 加 载 时 钟 信号 和 数据 (“D”) 输入 。D 触 发 器 的 时 序 图 显示 在 右边 


时 序 图 只 是 一 种 观察 途径 ， 用 来 考察 随时 间 变 化 时 多 个 信号 时 间 之 间 的 关系 。 如 果 你 见 过 电 
视 或 电影 里 (或 真实 生活 中 ) 测量 人 体 波形 的 情况 (比如 测 谎 仪 )， 你 会 看 到 几 个 身体 状态 参数 
的 图 线 在 条 带 记 录 纸 上 同时 绘 出 。 换 句 话 说， 时 序 图 也 可 看 成 是 对 D 触 发 器 进行 波形 测试 的 结果 。 

注意 图 中 时 钟 输入 端的 上 箭头 标志 “1 ”， 它 表示 一 个 上 升 沿 。 这 表明 仅 在 时 钟 (CLK) 输 
入 信号 变化 之 前 的 一 瞬间 ， 输 入 D 上 的 值 才 会 被 捕 抓 到 并 传递 给 输出 Q。 在 D 触 发 器 时 钟 输入 端 
的 符号 “=” 说 明 这 是 一 个 边沿 触发 (edge-triggered) 的 器 件 ， 它 对 逻辑 电位 的 实际 值 不 敏感 。 

对 于 R 和 S 输 入 信号 ， 我 们 在 其 输入 端 画 了 一 个 “气泡 ”标记 ,说 明 这 两 个 信号 都 是 在 低 
电位 时 活跃 (active) 或 有 效 (asserted)。 从 图 4-7 中 的 时 序 图 可 以 看 出 这 点 。 刚 过 t6 时 刻 ，5 
信号 就 变 低 。 再 经 过 一 点 传输 延迟 时 间 ，Q 变 高 而 Q 变 低 。 注 意 这 时 没有 任何 时 钟 信号 的 变 
化 ，R 和 S 都 是 异步 输入 信号 ， 它 们 可 以 不 管 时 钟 信号 的 行为 。 类 似 地 ，t8 时 刻 后 及 被 触发 ， 
门 的 输出 又 变 回 原来 的 状态 。 

图 4-7 的 D 触 发 器 由 两 个 单独 的 电路 功能 组 成 。 从 前 面 的 讨论 我 们 知道 它 实际 采用 的 是 主 
从 电路 结构 ， 输 入 R、 S 和 输出 Q、 Q 一 起 形成 了 一 个 类 似 于 我 们 在 图 4-1 中 见 到 的 RS 触发 器 。 
这 两 个 输入 比 D 输 入 和 “D 型 ”部 分 电路 中 的 时 钟 输入 的 优先 级 更 高 ， 在 任何 时 候 只 要 尺 或 
者 $ 低 有 效 ， 输 出 就 会 被 强迫 成 为 相应 的 值 。 

图 4-8 显 示 了 一 个 DD 型 触发 器 的 逻辑 电路 实现 。 虽 然 从 中 可 以 明显 地 看 出 主 从 电路 关系 ， 
但 这 个 电路 实现 不 再 像 前 面 讨 论 的 式 触 发 器 那样 容易 看 清楚 。 

图 4-8 中 的 电路 使 用 了 6 个 与 非 门 实现 D 触 发 器 的 设计 。 在 前 面 我 们 使 用 了 两 个 反 相 门 ， 故 
一 共和 需 8 个 门 来 将 式 触发 器 变 成 D 触 发 器 。 此 外 ， 注 意 在 图 4-8 中 没有 从 输出 到 输入 的 反馈 路 径 
来 实现 翻转 功能 。 在 D 触 发 器 中 ， 触 发 器 输出 翻转 并 不 是 一 个 工作 模式 ， 因 此 不 需要 增加 反馈 
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来 实现 这 个 功能 。 





图 4-8 D 型 触发 器 的 门 电 路 描述 


触发 器 输出 翻转 是 指 ， 当 有 一 个 时 钟 输入 脉冲 时 输出 信号 就 改变 其 状态 ， 这 是 一 个 数字 
系统 中 非常 有 用 的 功能 ， 下 面 让 我 们 更 仔细 地 研究 它 。 图 4-9 显 示 了 在 一 个 D 触 发 器 上 加 入 信 
号 翻转 功能 的 电路 。 为 了 实现 这 点 ，Q 输出 被 接 回 到 D 输 入 端 。 在 J 区 触发 器 中 ， 翻 转 功 能 是 
通过 分 别 将 输出 Q 和 Q 接 回 到 输入 K 和 J 上 实现 的 。 








图 4-9 在 分 频 电路 中 使 用 D 触 发 器 


参考 图 4-9 中 的 时 序 图 ， 我 们 看 到 当 在 触发 器 中 加 入 翻转 功能 后 ， 每 两 个 时 钟 脉冲 在 Q 
或 Q_ 上 产生 一 个 完整 的 时 钟 脉冲 。 每 次 出 现 一 个 时 钟 脉 冲 ， 都 导致 输出 信号 翻转 一 次 ， 这 样 
就 需要 使 两 个 时 钟 脉 冲 的 输出 翻转 回 原来 的 状态 。 
另 一 种 表述 方式 是 ， 输 出 Q 和 Q 上 波形 的 周期 是 时 钟 周期 的 两 倍 。 由 于 频率 是 周期 的 个 
[78] 数 ， 所 以 输出 Q 上 波形 的 频率 是 时 钟 输入 上 波形 频率 的 一 半 。 这 样 ， 如 果 时 钟 输入 的 频率 为 
1MHz， 则 Q 输 出 的 频率 为 0.5MHz， 即 500KHz。 
如 果 我 们 把 另 一 个 这 样 的 电路 放 在 图 4-9 中 电路 的 右边 ， 并 且 也 把 这 个 电路 的 Q 输出 接 回 
到 它 的 时 钟 输入 ,这 样 得 到 的 输出 信号 频率 会 再 减 一 半 ，, 图 4-10 显 示 了 这 样 的 情况 。 参 考 图 4-10， 
输入 时 钟 信号 的 波形 和 它 导致 在 输出 Q1 和 Q1 上 的 改变 示 于 图 中 ， 并 且 它 和 图 4-9 中 的 完全 一 样 。 
现在 ， 如 果 我 们 连接 QI 使 它 成 为 右边 第 二 个 D 触 发 器 的 输入 ， 那 么 电路 的 输出 行为 将 完全 一 
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样 ， 只 是 结果 波形 的 周期 加 倍 (频率 减 半 )。 
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图 4-10 两 个 D 触 发 器 串联 。 一 个 触发 器 的 Q 输出 成 为 下 一 个 触发 器 的 时 钟 输入 ， 
产生 的 时 钟 输入 和 Q 信 和 号 的 变化 示 于 时 序 图 中 


很 明显 ， 我 们 可 以 增加 任意 多 的 D 触 发 器 来 重复 这 个 练习 。 每 增加 一 个 D 触 发 器 ， 这 个 器 
件 的 输出 信号 周期 就 翻 倍 一 次 。 一 般 地 ， 对 于 N 个 D 触 发 器 形成 的 一 串 ， 第 N 个 触发 器 的 周期 
是 这 个 链 上 第 一 个 触发 器 输入 时 钟 周期 的 公 倍 。 只 要 将 足够 多 的 触发 器 联 成 一 串 ， 我 们 可 以 
容易 地 将 几 兆 赫兹 的 输入 波形 变 成 一 个 每 秒 一 个 周期 的 缓慢 波形 。 

现在 ， 让 我 们 进一步 看 看 这 种 D 触 发 器 串 的 另 一 个 性 质 。 在 图 4-11 中 ， 我 们 看 到 一 个 含 4 
个 D 触 发 器 的 链 式 电路 。 与 前 面 讨 论 的 电路 的 唯一 区 别 是 所 有 输入 R 均 被 连 在 一 起 ， 接 到 一 
个 不 时 会 产生 一 个 复位 RESET) 脉冲 的 信号 上 。 这 样 ， 只 要 我 们 加 载 一 个 负 脉 冲 到 这 个 电 
路 的 4 个 尽 输 入 上 ， 那 么 不 管 时 钟 信号 是 否 到 达 ， 所 有 的 Q 输 出 都 将 被 强制 为 0。 当 我 们 想 让 
这 个 电路 从 一 个 已 知 状态 开始 运行 时 ， 这 个 功能 非常 方便 。 事 实 上 ， 这 就 是 一 般 台 式 电脑 上 
那个 RESET (重启 动 ) 按钮 的 功能 。 


Qo Q。 ”Qs 


于 于 


图 4-11 用 D 触 发 器 构成 一 个 4 位 计数 器 和 16 分 频 器 
在 图 4-11 中 ， 有 4 个 和 图 4-9 中 电路 一 样 的 电路 。 注 意 ， 我 们 把 所 有 $ 输 入 接 在 了 一 起 ， 并 
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且 固 定 了 它们 的 电位 为 逻辑 电 平 1， 因 此 ， 我 们 再 没有 机 会 将 Q 输 出 “设置 ”为 1 了 。 在 数字 设 
计 中 ， 经 常 把 不 用 的 输入 端 固 定 接 到 逻辑 电 平 1 或 0 上 ， 这 样 可 以 保证 在 那个 输入 端 出 现 信 号 
噪声 的 情况 下 电路 不 会 意外 地 改变 状态 。 通 过 对 RS 触发 器 的 讨论 ， 我 们 知道 赋予 玉 低 电 平 信 
号 将 迫使 Q 输 出 为 0， 这 样 就 给 了 电路 一 个 已 知 的 初始 状态 。 

从 前 面 的 讨论 我 们 知道 ， 分 频 电 路 中 每 一 个 后 面 的 D 触 发 器 (或 者 电路 的 下 一 级 ) 将 输入 
的 时 钟 信号 一 分 为 二 ， 因 此 Q, 输 出 端的 信号 输出 频率 是 它 左 边 第 4 级 时 钟 信号 的 16 分 之 一 。 如 
果 在 CLK 输 入 端 是 一 个 16MHz 的 时 钟 信号 ， 那 么 在 Q; 输 出 端 得 到 的 将 是 一 个 I1MHz 的 信号 。 参 
考 图 4-12 中 逻辑 分 析 仪 的 显示 图 像 ， 
我 们 可 以 看 到 这 个 分 频 的 实际 过 程 。 
逻辑 分 析 仪 不 像 示波器 那样 能 显示 高 
保 真 的 波形 图 ， 它 能 同时 显示 多 个 波 
形 ， 但 会 损失 一 些 处 理 信息 。 因 此 ， 
逻辑 分 析 仪 得 到 的 视图 更 像 图 3-15。 

让 我 们 再 仔细 地 看 看 图 4-12。 时 
钟 信号 是 最 上 面 的 那个 波形 ， 而 每 个 
后 续 D 触 发 器 的 Q 输 出 由 下 面 的 一 个 波 
形 表示 。 让 我 们 比较 一 下 CLK 波 形 和 
直接 在 它 下 面 的 那个 Q0 波 形 。 图 4-13 
进行 了 标记 。 注 意 在 每 个 CLK 输 入 的 人 
上 升 沿 ，Q0 输 出 都 改变 状态 。 由 于 D 触 发 器 需要 信号 上 升 沿 来 促使 输出 改变 状态 ， 这 导致 的 
直接 后 果 就 是 需要 2 个 输入 信号 的 上 升 沿 才能 使 Q0 输 出 走 完 一 个 完整 的 变化 周期 。 

我 们 需要 重申 ， 图 4-11 的 电路 结构 还 有 一 个 有 趣 的 特 
点 。 我 们 前 面 说 过 ， 所 有 的 输入 下 是 连 在 一 起 的 ， 这 样 只 
要 将 它们 置 为 有 效 ， 那 么 不 管 时 钟 输入 的 状态 如 何 ， 所 有 
的 Q 输 出 都 将 被 强制 为 0。 这 样 ， 为 了 从 一 个 已 知 的 状态 
(所 有 输出 = 0) 开始 运行 这 个 系统 ， 我 们 就 必须 激活 这 个 
RESET 输 入 。 

假设 我 们 刚刚 激活 RESET 信 号 ， 从 Qo 到 Qs 的 4 个 信号 
都 为 0%， 这 时 左边 的 CLK 输 入 端 还 没有 时 钟 脉冲 进来 ， 这 个 
电路 处 于 静止 状态 。 突 然 ， 在 CLK 输 入 处 出 现 了 一 个 时 钟 
脉冲 ， 由 于 Q 输 出 为 1，D 输 入 为 1， 所 以 时 钟 脉冲 刚 过 ， 
这 个 最 左边 D 触 发 器 的 Q 输 出 就 变 成 了 1，6 输 出 的 值 由 1 变 
为 0。 这 是 一 个 下 降 沿 ， 所 以 对 第 2 个 D 触 发 器 没有 影响 。 

当 第 二 个 时 钟 脉冲 到 达 CLK 输 入 端 时 ， 第 一 个 D 触 发 
器 变 回 原来 的 状态 ， 它 的 输出 为 0。 但 是 ， 它 的 豆 输 出 此 时 
从 0 变 为 1， 导 致 Qi 变 为 1。 如 果 从 每 个 时 钟 脉冲 到 来 之 处 那 列 波形 向 下 看 ， 这 就 是 我 们 在 图 4-12 
中 看 到 的 。 作 为 练习 ， 请 画 一 张 真 值 表 ， 其 中 最 左边 一 列 顺序 列 出 时 钟 脉冲 的 编号 ， 而 从 Q0 到 
Q3 的 值 对 应 4 列 输出 。 从 时 钟 脉冲 0 ( 即 电 路 的 RESET 状 态 ) 开始 。 

如 果 做 完了 这 个 练习 ， 你 马上 会 发 现 这 个 电路 也 是 一 个 二 进 制 计数 器 ， 它 的 值 从 0000 变 








图 4-13 图 4-12 中 时 钟 输入 和 Q0 
输出 部 分 的 放大 视图 
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到 1111， 然 后 在 第 16 个 时 钟 脉冲 时 再 变 回 0000。 不 要 惊 讨 ， 我 们 甚至 可 以 一 级 一 级 地 增加 触 
发 器 来 实现 任意 位 数 的 计数 器 。 这 个 独特 的 计数 配置 称 为 行 波 计 数 器 (ripple counter) ， 因 为 
在 每 一 级 状态 改变 时 计数 值 像 波浪 一 样 传递 。 计 数值 “上 下 起 伏 ” 地 通过 这 个 计数 器 电路 意 
味 着 ,在 前 一 个 脉冲 导致 的 计数 改变 完全 传递 到 整个 电路 之 前 我 们 有 可 能 接收 到 下 一 个 脉冲 。 
虽然 计数 器 仍 会 保持 准确 的 计数 ， 但 这 将 对 我 们 准确 地 读 取 这 个 计数 值 带 来 影响 。 

到 现在 为 止 ， 我 们 所 关注 的 数字 电路 中 每 个 输入 或 输出 变量 都 在 独自 占用 一 根 信号 线 。 
如 果 想 在 一 个 微 处 理 器 中 传输 32 位 数据 ， 我 们 需要 使 用 包括 32 根 线 的 一 东信 号 线 来 移动 数据 。 
由 于 每 一 个 数据 位 或 变量 是 并 行 于 其 他 数据 位 传输 的 ， 所 以 这 种 情况 称 为 并 行 (parallel) 数 
据 分 布 。 此 外 ， 还 有 一 些 情况 下 需要 使 用 囊 行 (serial) 数据 传输 方式 ， 在 这 种 方式 下 所 有 数 
据 位 顺序 地 通过 一 根 线 或 者 最 多 几 根 线 。 你 可 能 比较 熟悉 的 一 些 并 行 数据 传输 协议 的 例子 是 : 

。 并 行 端口 ，LPT 

。PCI 总 线 

。AGP 总 线 

。IEEE 488 (HP-IB) 

而 串 行 数据 传输 协议 的 例子 是 : 

。 RS-232 端 口 (COM 端 日 ，COM1,…, COM4) 

。 以 太 网 

。USB 端 口 

e。 Firewire 

我 们 现在 看 一 个 由 D 触 发 器 搭建 的 电路 ， 它 可 将 串 行 数据 格式 转换 为 并 行 数据 格式 。 显 然 
这 个 功能 非常 重要 ， 一 旦 收 到 了 串 行 数据 我 们 必须 有 办 法 让 计算 机 能 处 理 它 。 我 们 使 用 的 这 [81] 
个 电路 结构 称 为 移 位 寄存 器 (shift register) ， 请 看 图 4-14。 


Qo Qi Q, Qs 
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图 4-14 由 D 型 触发 器 构成 的 4 位 移 位 寄存 器 


像 图 4-11 中 的 行 波 计数 器 一 样 ， 这 些 触发 器 的 RESET 输 入 端 (R) 连 在 一 起 ， 这 使 得 我 们 
可 以 让 所 有 触发 器 输出 同时 变 为 0。 然 而 ， 与 图 4-11 电 路 最 大 的 区 别 是 ， 我 们 将 CLK (时 钟 ) 
输入 也 连 在 了 一 起 ， 而 且 每 个 触发 器 的 Q 输 出 都 直接 接 到 了 下 一 个 触发 器 的 D 输 入 上 。 这 样 ， 
每 当 CLK 输 入 端 出 现时 钟 上 升 治 时 ，D 触 发 器 就 获得 它 左 边 那 个 触发 器 的 Q 输 出 值 。 由 于 所 有 
的 CLK 输 入 同时 激活 ， 所 以 随 着 每 次 时 钟 的 上 升 沿 ， 最 左边 那个 D 触 发 器 上 的 输入 数据 看 上 去 
就 像 在 这 个 移 位 触发 器 上 从 左 到 右 地 一 步 步 移动 似 的 。 

让 我 们 看 看 这 会 是 一 个 怎样 的 波形 。 假 设 我 们 想 通 过 一 个 串 行 线 传递 一 个 数字 6， 即 二 进 
制 的 0110。 将 并 行 数据 转换 为 串 行 数据 的 方法 类 似 于 将 它 从 串 行 变 为 并 行 的 过 程 ， 这 里 我 们 





人 人 


不 考虑 它 。 我 们 现在 假设 数据 0110 是 一 个 按时 钟 信号 传输 的 一 个 波形 ， 如 图 4-15 所 示 。 


最 高 有 效 位 0 1 1 0 最 低 有 效 位 


数据 


时 钟 


图 4-15 二 进 制 数 6 的 串 行 数据 传输 


数据 值 按时 钟 的 上 升 沿 进行 同步 ， 而 这 个 同步 时 钟 信号 既 可 能 随 这 个 数据 进行 传输 ， 也 
可 能 不 随 这 个 数据 进行 传输 。 有 时 时 钟 信号 是 由 数据 接收 设备 自己 生成 的 ， 而 不 是 像 数据 那 
样 从 发 送 设备 那里 传 过 来 的 。 计 算 机 上 的 COM 端 口 就 是 这 样 工作 的 。 另 外 一 些 技术 涉及 将 时 
钟 信号 结合 进 数据 中 ， 并 用 一 根 信和 号 线 传 输 它 们 ， 而 在 接收 端 使 用 特殊 电路 恢复 数据 中 的 时 
钟 信号 。 无 论 哪 种 情况 ， 都 需要 时 钟 信号 的 同步 ， 以 便 在 触发 器 的 D 输 入 端 捕捉 数据 ， 所 以 ， 
需要 4 个 时 钟 脉冲 ， 每 一 个 对 应 地 接收 一 个 数据 位 。 

图 4-16 显 示 了 4 个 数据 位 通过 D 触 发 器 的 过 程 。 让 我 们 假设 在 这 个 例子 中 使 用 两 根 不 同 的 
线 分 别传 输 数据 和 时 钟 ， 就 像 图 4-1S 所 示 的 那样 。 图 4-15 实 际 上 是 一 个 信号 随时 间 变 化 的 图 ， 
因此 假设 我 们 有 一 支 很 快 的 笔 和 纸 ， 每 次 时 钟 信号 出 现 上 升 洛 ， 我 们 就 记录 另外 一 条 线 上 的 
信号 状态 ， 我 们 将 依次 看 到 0、1、1、0。 这 个 图 乍 一 看 可 能 不 是 那么 清楚 ， 我 们 下 面 就 分 析 
它 的 意义 。 在 t1 时 刻 的 时 钟 沿 到 来 之 前 ， 最 
左边 D 触 发 器 的 D 输 入 为 0， 而 且 所 有 触发 器 
的 输出 均 已 复位 为 0。 在 tl 时 刻 ，D 输 入 上 的 
0 被 传输 到 Q 输 出 ， 由 于 输出 已 经 是 0， 所 以 
就 像 什么 都 没 发 生 一 样 。 

现在 快要 到 t2 时 刻 了 ， 最 左边 的 D 输 入 
变 为 1。 刚 过 t2 时 刻 ，Q0 就 变 为 1， 反 映 出 D 
输入 上 的 值 。 所 有 其 他 的 输出 还 是 0， 因 为 
它们 仍然 在 传递 第 一 个 数据 0。 在 t3 时 刻 ， 


第 3 个 数据 位 1 被 时 钟 脉冲 打 入 最 左边 的 D 触 
发 器 ， 而 其 他 数据 在 向 右边 移动 。 这 样 ， 刚 
过 时 刻 t3 时 ， 从 Q0 到 Q3 的 输出 分 别 是 1100。 
最 后 ， 在 t4 时 刻 之 后 ， 数 据 位 又 右 移 了 一 次 ， 





t1 t; t3 t4 
图 4-16 串 行 数据 通过 4 位 移 位 寄存 器 的 过 程 


输入 的 串 行 数据 就 完整 地 存储 于 移 位 寄存 器 中 


成 为 并 行 值 了 。 


4.3 存储 寄存 器 


我 们 将 要 看 到 的 D 触 发 器 电路 的 最 后 一 个 例子 也 可 能 是 所 有 中 最 重要 的 ， 就 是 存储 寄存 
器 (storage register)。 存 储 寄 存 器 是 一 组 D 触 发 器 ， 它 被 设计 用 来 接收 和 保存 数字 数据 值 。 
这 个 数据 值 可 以 是 位 、 半 字 节 、 字 节 、 字 、 长 字 、 双 字 ， 等 等 。 关 键 点 是 ， 一 个 时 钟 信号 可 
以 使 所 有 的 D 触 发 器 同时 存储 它们 D 输 入 端的 数据 ， 在 这 个 意义 上 ， 它 是 一 个 并 行 输 入 /并 行 
输出 设备 。 
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与 存储 害 存 器 相 比 ， 图 4-14 所 示 的 移 位 寄存 器 是 一 个 串 行 输入 /并 行 输出 的 设备 。 我 们 之 


”所 以 需要 存储 寄存 器 ， 是 因为 计算 机 中 的 数据 流动 瞬息万变 ， 我 们 必须 有 一 个 临时 存储 这 些 


数据 的 地 方 ， 使 得 我 们 能 把 它们 保存 到 我 们 需要 的 时 候 ， 或 者 存储 计算 指令 的 结果 直到 我 们 
将 它们 移动 到 某 个 其 他 地 方 。 

图 4-17 显 示 了 一 个 存储 寄存 器 的 配置 图 以 及 其 中 的 8 个 D 触 发 器 。 我 们 可 以 看 到 ， 在 D 输 
入 端 (图 中 的 深 灰 色 线 ) 上 的 任何 数据 经 过 一 个 时 钟 上 升 沿 之 后 将 存储 于 寄存 器 的 触发 器 中 。 
然后 ， 这 些 数据 就 可 作为 输出 ( 浅 灰 色 线 ) 传递 出 去 。 然 而 ， 关 键 点 其 实 是 输入 数据 值 ( 深 
灰色 线 上 的 信号 ) 现在 可 以 改变 ,但 寄存 器 仍然 保留 以 前 的 数据 。 


DO D1 D2 D3 D4 D5 D6 D7 DO D1 D2 D3 D4 D5 D6 D7 


输入 数据 l 输出 数据 


图 4-17 一 个 8 位 存储 寄存 器 。 在 时 钟 上 升 沿 时 D 触 发 器 捕 提 到 输入 数据 ( 深 灰 色 线 )， 这 些 数 据 随后 出 现 
在 输出 端 ( 浅 灰色 线 )。 这 种 寄存 器 通常 没有 SET 和 RESET 输 入 ， 因 此 图 中 也 没有 画 出 它们 


在 大 多 数 计算 机 中 ， 形 成 存储 寄存 器 的 D 触 发 器 的 数目 和 计算 机 数据 通路 的 数据 位 数 是 一 
致 的 。 当 前 我 们 用 的 计算 机 中 ， 数 据 通路 的 宽度 从 4 位 到 128 位 不 等 。 这 些 寄 存 器 是 现代 计算 
机 和 微 处 理 器 的 关键 “数据 容器 "。 在 后 面 的 章节 中 ， 你 将 看 到 不 同 的 存储 寄存 器 的 数量 和 类 
型 定义 了 不 同 的 计算 机 体系 结构 。 

为 了 强调 存储 寄存 器 是 一 个 独特 的 电路 元 件 ， 而 不 是 一 组 D 触 发 器 ， 我 们 将 图 4-17 重 画 为 
图 4-18 。 

在 本 章 前 面 的 部 分 ， 我 们 反复 提 到 一 个 触发 器 的 “状态 ”这 个 概念 。 实 际 上 我 们 想 说 的 
是 ,为 了 知道 Q 和 Q 输出 的 新 值 ， 我 们 必须 了 解 适当 的 时 钟 信 号 边沿 将 要 到 来 之 前 输入 和 输 
出 的 当前 值 (或 状态 )。 所 有 这 些 都 是 为 了 引入 状态 机 的 概念 而 做 的 准备 。 

状态 机 的 状态 代表 了 一 个 数字 系统 可 能 存在 的 所 有 输入 和 输出 的 组 合 ， 也 包括 了 这 个 系 
统 在 状态 机 的 各 种 状态 之 间 变 化 的 路 径 。 此 外 ， 也 可 能 是 最 重要 的 一 点 是 ， 状 态 机 可 以 根据 
其 输入 条 件 的 变化 改变 其 状态 迁移 的 路 径 。 不 像 我 们 前 面 学 习 的 异步 组 合 逻 辑 ， 状 态 机 是 一 
种 同步 设备 。 这 意味 着 状态 机 仅 能 在 时 钟 的 边沿 改变 状态 。 从 中 你 可 能 会 得 到 上 暗示，D 触 发 器 


[83 | 
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和 状态 机 应 该 有 某 种 共同 的 血统 关系 。 这 完全 正确 ! 通过 一 个 表 或 一 个 图 ( 称 为 状态 迁移 图 
(state transition diagram))， 我 们 可 以 最 好 地 描述 一 个 状态 机 的 行为 。 请 看 图 4-19。 | 


Do D1 D2 D3 D4 D5 D6 D7 DO D1 D2 D3 D4 D5 D6 D7 





输入 数据 输出 数据 


图 4-18 重 画图 4-17 中 的 电路 ， 以 显示 8 个 独立 的 D 触 发 器 聚集 成 一 个 单个 器 件 。 因 为 存储 寄存 器 
是 大 多 数 计算 机 系统 的 有 机 组 成 部 分 ， 所 以 它 应 该 被 看 成 是 完全 不 同 于 D 触 发 器 的 


D Q 当前 输入 当前 状态 下 一 状态 





i 


输入 
图 4-19 一 个 D 型 触发 器 的 状态 迁移 图 和 真 值 表 。 为 了 清晰 ， 省 略 了 异步 输入 SET 和 RESET 
图 4-19 中 深 色 的 圈 是 系统 的 状态 。 这 个 系统 有 两 个 状态 : 01 和 10， 分 别 对 应 于 Q=0、Q=1 


和 Q=1、Q =0。 带 箭头 的 线 表示 状态 间 的 迁移 ， 而 其 旁边 的 数字 表示 在 迁移 时 的 输入 条 件 。 


因此 ， 如 果 当 前 设备 处 于 状态 01, 则 当 D=0 时 它 将 保持 这 个 状态 , 而 当 D=1 时 它 的 状态 变 为 10。 
类 似 地 ， 如 果 设 备 处 于 状态 10， 那 么 当时 钟 信号 到 来 时 ， 如 果 D=1 则 它 保持 这 个 状态 ， 如 果 
D=0 则 转换 到 状态 01。 

状态 之 间 的 转换 发 生 在 时 钟 的 上 升 沿 到 来 的 时 候 ， 图 中 的 箭头 暗示 了 这 一 点 。 即 便 是 时 
钟 信 号 到 来 之 后 D 触 发 器 还 保持 原来 状态 的 情况 ， 我 们 仍然 画 一 根 带 箭头 的 线 表示 经 过 状态 转 
换 它 还 回 到 原来 的 状态 。 
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与 状态 迁移 图 一 样 ， 真 值 表 ( 示 于 图 4-19 的 右 半 部 分 ) 也 提供 了 状态 机 的 有 关 人 信息， 只 
是 没 状态 迁移 图 那么 直观 。 为 了 简单 ， 我 们 在 真 值 表 中 忽略 了 D 触 发 器 的 Q 输出 。 表 的 4 行 分 
别 代表 4 种 可 能 发 生 的 状态 迁移 情况 。 值 得 注意 的 是 ， 输 出 变量 有 两 个 含义 ， 分 别 表 示 在 时 钟 
脉冲 上 升 沿 到 来 前 后 的 输出 值 。 

图 4-20 是 我 们 讨论 过 的 图 4-11 中 4 位 计数 器 的 状态 迁移 图 。 由 于 这 个 电路 中 除了 时 钟 外 没 
有 任何 同步 输入 信号 ， 所 以 这 个 状态 图 非 党 简单、 直观。 无 论 这 个 计数 器 当前 是 什么 状态 ， 
它 的 下 一 个 状态 都 是 预先 确定 的 。 如 果 RESET 输 入 可 以 是 同步 信号 (这 很 容易 办 到 ,但 我 们 
不 想 增加 麻烦 ) ， 那 么 图 4-20 中 的 每 个 围 都 可 以 通过 一 根 箭头 线 回 到 0000 状 态 。 这 些 RESET 箭 
头 线 上 都 应 该 加 一 个 RESET = 0 的 标签 ， 用 来 说 明 RESET 输 入 为 0 将 使 计数 器 在 下 一 个 时 钟 脉 
冲 到 来 时 回 到 0000 状 态 。 而 所 以 其 他 的 箭头 线 上 则 应 标 上 RESET = 1， 说 明正 常情 况 下 计数 
器 如 何 迁 移 到 下 一 个 状态 。 

在 前 面 的 第 3 章 中 ， 我 们 考虑 过 一 种 实 
现 异步 逻辑 的 可 能 方式 是 直接 将 真 值 表 存 在 
存储 设备 中 ， 就 像 图 3-9 所 示 的 那样 。 这 样 
可 以 立刻 消除 所 有 门 电路 设计 中 的 问题 。 当 
时 我 们 没有 讨论 这 种 系统 与 其 他 电路 实现 的 
优 劣 对 比 ， 只 是 指出 我 们 在 后 面 还 会 详细 说 :无 论 当 前 是 什么 次 态 ;下 
明 。 现 在 让 我 们 详细 地 讨论 一 下 这 个 问题 ! 个 状态 者 是 确定 的 。， 到 
但 是 ,在 我 们 讨论 这 个 与 状态 机 有 关 的 问题 
之 前 ， 先 回顾 一 下 计算 机 存储 器 的 结构 可 能 
会 有 帮助 。 我 们 在 后 面 某 章 中 会 学 到 更 多 的 
关于 存储 器 的 知识 ， 但 现在 让 我 们 复习 一 下 
编程 课 上 学 习 的 有 关 存 储 器 的 内 容 。 

一 个 存储 器 件 ， 比 如 说 随机 访问 存储 器 
RAM 或 只 读 存 储 器 ROOM 芯片， 包含 了 大 量 
的 存储 单元 (memory cell) ， 每 个 单元 可 以 
存单 个 1 值 或 0 值 。 可 以 想像 ， 这 些 单元 可 以 图 4.20 一 个 4 位 计数 器 的 状态 迁移 图 
按 各 种 组 合 组 织 成 不 同 存储 字 宽 (memory 
width) 的 存储 器 。 只 要 我 们 知道 了 一 个 存储 设备 总 共有 多 少 个 单元 以 及 这 个 存储 器 的 字 宽 ， 
就 可 以 算出 它 需要 多 少 存储 地 址 (memory address) 。 举 一 个 例子 可 能 说 得 更 清楚 。 假 设 我 们 
有 一 个 存储 器 ， 它 包含 16 384 个 存储 单元 ， 每 个 单元 存 一 个 三 进 制 位 的 数据 。 如 果 我 们 将 它 
设计 成 每 次 读 存 储 器 访问 可 得 到 一 个 8 位 的 数字 ， 换 名 话说， 我 们 想 用 这 个 存储 器 存 字 符 
(char) 类 型 的 数据 ， 那 么 ， 总 的 地 址 数 就 是 16 384/8 = 2 048， 这 样 ， 该 存储 器 将 包含 ， 

。16 384 个 存储 单元 ， 

。 用 来 读 写 存储 器 数据 的 8 根 数据 线 ， 

。2 048 个 可 单独 寻 址 的 存储 器 位 置 ， 

。 提供 2 048 种 不 同 地 址 组 合 的 11 根 地 址 线 。 | 

你 可 能 想 知道 这 个 11 根 地 址 线 是 怎么 算出 来 的 。 考 虑 到 我 们 要 访问 2 048 个 不 同 的 地 址 ， 
因此 第 一 个 地 址 应 该 是 0000， 而 最 后 一 个 地 址 应 该 是 2 047。 各 位 都 是 0 的 数 也 是 个 有 效 地 址 ， 
这 看 上 去 有 点 奇怪 ， 但 计算 机 科学 家 是 一 群 不 怕 辛 苦 的 家 伙 ， 他 们 能 够 处 理 它 ! 

在 二 进 制 数 的 系统 中 ，2 048 个 独特 的 地 址 表示 为 从 000 0000 0000 到 111 1111 1111 之 间 的 
数 。 注 意 我 们 需要 11 位 二 进 制 数 字 表 示 从 0000 到 2 047 的 所 有 可 能 地 址 。 由 于 0000 也 是 一 个 有 
效 地 址 ， 所 以 一 般 来 说 最 高 地 址 (所 有 二 进 制 位 都 为 1) 比 不 同 地 址 的 数目 小 1。 
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这 样 ， 你 可 以 想像 这 个 独特 的 存储 器 设备 被 组 织 成 2 048 x 8 的 结构 。 我 们 可 以 改变 要 求 ， 
比如 说 希望 用 这 个 存储 器 存 32 位 字 宽 的 整数 。 由 于 每 个 地 址 对 应 的 位 置 上 都 有 更 多 的 存储 单 
元 ， 所 以 只 能 用 较 少 的 处 理 地 址 来 安排 。 因 为 存储 器 的 字 宽 是 前 面 那 种 情况 的 4 倍 ， 所 以 地 址 
数量 也 就 只 有 原来 的 四 分 之 一 。 新 的 存储 器 将 包括 : 

。16 384 个 存储 单元 ， 

。 用 来 读 写 存 储 器 数据 的 32 根 数据 线 ， 

。512 个 可 单独 寻 址 的 存储 器 位 置 ， 

。 提供 512 种 不 同 地址 组 合 的 9 根 地 址 线 。 

这 些 和 状态 机 有 什么 关系 呢 ? 让 我 们 回忆 一 下 图 3-9， 那 个 图 中 显示 了 一 个 真 值 表 ， 并 且 
看 上 去 非常 像 一 个 存储 器 。 图 3-9 中 的 真 值 表 有 4 个 独立 的 输入 变量 (从 A 到 D) 和 两 个 输出 变 
量 (E 和 F) 。 从 前 面 的 讨论 中 ， 我 们 知道 这 是 一 个 有 4 根 地 址 线 、2 位 输出 字 宽 的 存储 器 ， 这 个 
存储 器 包含 32 个 存储 单元 。 

上 面 的 讨论 并 不 意味 着 存储 器 是 存储 状态 机 的 状态 迁移 信息 的 唯一 方法 。 既 然 存储 器 只 
是 对 真 值 表 的 一 种 精确 映射 ， 我 们 也 可 以 用 本 章 前 面 的 方法 来 实 
现 这 种 映射 。 也 就 是 说 ， 为 每 个 输出 变量 建立 一 个 卡 诺 图 ， 并 推 
导出 简化 的 最 小 项 表达 式 。 然 后 我 们 就 可 以 得 到 真 值 表 的 门 电路 
表达 形式 ， 从 而 实现 状态 机 。 如 何 做 各 种 选择 来 实现 这 个 设计 取 
决 于 许多 因素 ， 还 是 让 硬件 工程 师 来 考虑 这 个 问题 吧 。 

现在 ， 假 设 我 们 想 实际 设计 一 个 状态 机 ， 那 么 微 处 理 器 是 一 个 
很 好 的 例子 。 我 们 该 怎么 设计 呢 ? 首先 ， 我 们 可 能 需要 上 一 些 更 多 
.的 关于 计算 机 科学 和 电子 工程 的 课程 ， 但 这 并 不 能 阻止 我 们 在 这 里 
讨论 ， 我 们 可 以 比较 粗略 地 进行 分 析 。 如 果 要 建造 一 个 微 处 理 器 ， 
那么 首先 要 为 它 的 核心 功能 设计 一 个 状态 机 。 这 个 状态 机 可 能 有 :上 《图 4-21 普通 的 硬件 设计 者 
千 种 可 能 的 状态 、 几 百 种 输入 、 输 出 信号 (变量 )， 使 用 逻辑 门 电 
路 来 设计 它 会 很 困难 ， 那 么 用 存储 器 来 实现 它 的 真 值 表 将 会 比较 容易 一 些 。 下 面 考虑 图 4-22。 





16 x 4 存储 阵列 
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图 4-22 一 个 16 x 4 存储 阵列 组 织 成 状态 机 的 真 值 表 形 式 
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这 个 电路 有 4 个 输入 变量 (从 Ai 到 Di) 和 4 个 输出 变量 〈 从 Au 到 Do) 。 输 入 变量 形成 某 


个 存储 单元 的 地 址 ， 其 值 从 0000 到 1111， 输 出 变量 则 为 输入 地 址 指定 的 存储 单元 中 的 数据 。 
图 4-23 进 一 步 解释 了 这 点 。 
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D3 
16 x 4 存储 阵列 


图 4-23 用 16 x 4 存储 阵列 和 一 个 4 位 存储 寄存 器 实现 状态 机 。 输 出 变量 反馈 回 输 入 提供 下 一 个 状态 的 地 址 


在 图 4-23 中 ， 从 A0 到 A3 是 存储 器 单元 的 地 址 ， 从 D0 到 D3 为 相应 单元 中 存储 的 4 位 数据 。 
状态 机 的 输出 ， 从 Q0 到 Q3 驱 动 剩 下 的 电路 ， 同 时 也 连 回 存储 器 的 输入 来 提供 下 一 个 状态 的 地 
址 。 这 个 4 位 存储 寄存 器 提供 了 关键 的 同步 功能 。 由 于 数据 仅 在 正 时 钟 跳 变 到 来 时 从 D 输 入 传 
递 给 Q 输 出 ， 所 以 这 个 寄存 器 隔离 了 输入 信号 和 输出 信号 之 间 的 相互 干扰 ， 防 止 了 电路 以 一 种 
不 可 控制 的 方式 工作 。 

在 状态 机 中 ， 这 个 4 位 D 存 储 寄存 器 提供 了 和 边沿 触发 的 触发 器 中 主 - 从 电路 完全 一 样 的 


功能 。 如 果 没 有 这 个 D 触 发 器 提供 合适 的 同步 机 制 ， 我 们 的 这 个 电路 将 变 得 不 可 控制 。 为 了 解 
释 这 一 点 ， 请 看 图 4-24 中 的 电路 。 





图 4-24 情况 A: 存在 竞争 条 件 的 电路 。 由 输出 反馈 回 输入 的 信号 总 与 当前 输入 信号 有 相反 的 极 性 ， 电 路 无 法 
建立 一 个 稳定 的 状态 。 情 况 B: D 触 发 器 使 用 电路 稳定 ， 并 将 状态 迁移 限制 为 仅 在 时 钟 上 升 沿 时 发 生 
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在 情况 A 的 电路 中 ， 三 个 非 门 〈 其 实 任何 多 于 1 的 奇数 个 非 门 都 可 以 ) 连 成 了 一 个 回路 。 
我 们 可 以 这 么 分 析 这 个 电路 : 假设 某 一 时 刻 门 A 的 输入 变 为 高 电压 ， 经 过 一 合适 的 时 间 间 隔 门 
A 的 输出 信号 将 变 为 低 电 压 ， 这 个 时 间 间 隔 由 门 A 的 延迟 时 间 决 定 (我 们 假设 它 为 10ns)。 由 
于 A 的 输出 是 B 的 输入 ， 所 以 上 面 这 个 过 程 在 门 B 和 门 C 上 重复 ， 最 后 信号 传递 回 门 A 的 输入 。 
因此 在 门 A 的 输入 信号 变 高 后 再 过 30ns， 这 个 输入 信号 将 变 为 低 电 压 ， 并 且 这 个 过 程 会 一 直 进 
行 下 去 。 经 过 60ns 后 ， 门 A 的 输入 再 次 变 高 ， 这 就 形成 了 一 个 完整 的 周期 。 这 是 一 个 经 典 的 竞 
争 条 件 (race condition) ， 并 且 一 般 不 应 该 让 它 发 生 。 

事实 上 ， 如 果 需 要 这 种 情况 也 不 是 那么 坏 。 这 是 我 们 产生 时 钟 脉 冲 信号 的 一 种 方式 ， 我 
们 称 这 个 电路 为 振荡 器 (oscillator) 电路 。 通 过 一 些 简 单 的 操作 ， 我 们 可 以 在 这 个 电路 中 加 
入 一 个 晶体 ， 这 个 振荡 器 的 频率 和 周期 就 会 非常 精确 。 在 图 4-24 所 显示 的 例子 电路 中 ， 振 荡 
频率 将 是 60ns 的 倒数 ， 大 约 16.7 MHz。 

情况 B 中 的 电路 明显 地 消除 了 这 种 振荡 。 虽 然 在 每 次 时 钟 信号 上 升 沿 到 来 时 DD 输入 的 值 都 
发 生 翻转 ,但 这 个 电路 是 稳定 的 。 这 里 没有 不 受 控制 的 信号 状态 改变 ， 系 统 中 所 有 状态 迁移 
都 由 时 钟 的 上 升 沿 到 来 并 更 新 D 触 发 器 所 引起 。 

上 面 举 的 令 人 愉快 的 这 个 小 例子 和 状态 机 有 什么 关系 呢 ? 关 系 大 了 ! 如 果 在 电路 中 没有 
放 D 触 发 器 ， 那 么 将 存储 器 的 输出 反馈 回 它 的 输入 将 产生 竞争 条 件 ， 状 态 机 对 我 们 就 没有 用 处 
了 。 通 过 D 触 发 器 ， 我 们 控制 了 输出 反馈 回 和 输入、 改变 存储 器 地 址 的 时 机 ， 这 就 是 我 们 所 希望 
的 状态 迁移 方式 。 

这 种 采用 触发 器 的 设计 隔离 了 当前 状态 (输出 Q0 到 Qn) 和 下 一 个 状态 ， 仅 仅 在 时 钟 上 升 
沿 到 来 的 那 段 短 暂时 间 内 ， 触 发 器 的 输出 可 以 按照 D 输 入 的 信号 改变 状态 。 在 那个 时 刻 ， 状 态 
机 进入 新 的 状态 并 且 将 输出 反馈 回 存 储 器 的 地 址 输入 端 ， 为 下 一 个 状态 提供 地 址 。 存 在 那个 
地 址 上 的 数据 就 为 下 一 次 状态 转换 提供 值 ， 并 且 这 个 转换 在 时 钟 的 下 一 次 上 升 沿 到 来 时 发 生 。 

现在 ， 我 们 可 以 总 结 一 下 这 种 电路 结构 : 

。 就 像 真 值 表 包 含 系 统 所 有 可 能 的 逻辑 项 一 样 ， 存 储 单元 中 存放 了 系统 的 所 有 可 能 状态 。 

。 存储 阵列 ( 真 值 表 ) 的 输出 是 D 存 储 寄 存 器 的 输入 ， 并 且 会 在 下 一 个 时 钟 脉冲 上 升 沿 到 

来 时 成 为 状态 机 的 新 状态 。 
。DD 存 储 寄存 器 的 输出 是 系统 的 当前 状态 。 这 个 输出 用 于 控制 外 部 电路 的 输入 ， 也 为 下 一 
个 状态 提供 了 存储 阵列 的 地 址 信号 。 

。D 存 储 寄存 器 隔绝 了 状态 机 的 输出 和 状态 机 的 输入 ， 仅 允许 在 时 钟 信号 上 升 沿 发 生 状 态 

转换 。 


总 结 


* 信号 反馈 创造 了 一 种 有 状态 依赖 性 的 电路 元 件 。 也 就 是 说 ， 这 种 元 件 的 输出 状态 不 仅 
依赖 于 输入 状态 ， 还 依赖 于 时 钟 脉冲 以 及 时 钟 脉冲 到 来 之 前 的 输出 状态 。 

。 这 种 电路 的 最 简单 形式 是 RS 触发 器 ， 其 用 处 非常 有 限 。 

* 一旦 加 入 主 -从 触发 器 的 功能 ， 我 们 就 能 克服 由 RS 触发 器 设计 带 来 的 许多 不 稳定 性 。 

。 了 焉 触发 器 是 这 种 设备 的 最 通用 形式 。 

。 一 个 派生 出 来 的 设计 ，D 触 发 器 具备 数据 存储 元 件 的 附加 特性 。 

* DD 触发 器 可 以 配置 成 计数 器 、 移 位 寄存 器 和 存储 寄存 器 。 

*。 DD 触发 器 是 实现 状态 机 的 关键 元 件 ， 因 为 它 限制 了 可 能 的 系统 状态 变化 ， 让 它 仅 在 时 钟 
冒号 上 升 沿 时 发 生 。 
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? 在 我 曾 工作 过 多 年 的 惠普 公司 的 那个 部 门 里 ， 对 硬件 设计 者 和 软件 设计 者 有 不 同 的 绰号 。 硬 件 设计 者 被 称 为 
“ 蟾 崔 ”， 软 件 设计 者 被 称 为 “ 火 鸡 "。 我 不 知道 这 种 习惯 叫 法 是 怎么 来 的 ， 他 们 就 这 么 叫 。 既 能 设计 硬件 也 能 
设计 软件 的 人 有 时 被 叫 作 “公鸡 ”， 我 们 其 实 很 少 这 么 叫 。 

过 了 这 些 年 ， 我 又 发 现 了 一 些 其 他 的 关于 硬件 设计 者 和 软件 设计 者 的 不 同 现象 。 硬 件 设计 者 经 常 穿 那 种 
不 用 系 鞋 带 的 耐克 慢跑 鞋 ， 而 软件 设计 者 则 经 常 穿 凉鞋 (Birkenstock) 。 我 过 去 习惯 于 穿 慢 跑鞋 ， 但 最 近 我 发 
现 我 越 来 越 多 地 穿 Birkenstock 了 。 是 在 计算 机 系 教书 改变 了 我 的 本 性 吗 ? 只 有 时 间 才能 给 出 答案 。 


习题 


(注意 : 用 星 号 标记 的 题目 尤其 有 挑战 性 ) 

1. 下 面 图 中 显示 的 电路 包括 三 个 D 型 触发 器 。 图 中 黑 圆 点 表示 相关 的 线 互 相 之 间 有 物理 连 
接 。 RESET 输入 端 永远 接 在 逻辑 1 上 ， 因 此 永远 不 会 有 效 。 在 时 钟 脉冲 到 来 之 前 ， 所 有 
的 SET 输入 都 会 收 到 一 个 负 脉冲 以 建立 电路 的 初始 状态 。 

画 出 这 个 电路 的 状态 迁移 图 ， 注 意 按 Q0、Q1 和 Q2 的 顺序 表示 状态 。 一 定 要 显示 题目 中 给 
出 的 起 始 状态 ， 以 及 所 有 其 他 的 后 续 状 态 。 用 带 箭头 的 线 表示 从 一 个 状态 到 另 一 个 状态 的 迁移 。 





假设 在 时 刻 T0， 刚 刚 出 现 一 个 RESET 信 号 ， 使 得 输出 Q0、Q1 和 Q2 为 低 电 压 状 态 。 请 
画 出 输出 Q0、Q1 和 Q2 的 时 序 图 。 
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为 了 简单 起 见 ， 你 可 以 假设 信号 通过 触发 器 时 没有 延迟 ， 这 样 一 旦 输入 时 钟 信号 出 现 
上 升 沿 ， 输 出 就 改变 其 状态 。 

[91] 3. 考虑 下 面 显 示 的 电路 。 假 设 已 经 出 现 
了 CLEAR 脉冲 信号 让 状态 清 零 。 为 这 
个 电路 创建 一 个 真 值 表 ， 显 示 经 过 4 
个 时 钟 周期 后 的 输出 状态 。 
. 下 面 显示 的 图 中 有 4 个 D 型 触发 器 和 
一 个 异 或 门 (XOR)。 首 先 RESET 
六 号 将 所 有 QQ 输 出 清 零 。 图 中 线 交 
又 处 的 黑 贺 点 表示 两 根 线 有 电学 上 
的 连接 ， 否 则 没有 。 请 创建 真 值 表 ， 
显示 经 过 4 个 时 钟 周期 后 Q0 到 Q3 的 
输出 。 
















上 


5. 考虑 下 面 的 电路 ， 它 包括 4 个 D 型 触发 器 和 一 个 蜡 或 门 (XOR)。 假 设 电 路 上 加 载 了 一 个 
RESET 信 号 ， 让 输出 A、B、C 和 D 都 变 为 零 。 请 创建 真 值 表 显 示 经 过 8 个 时 钟 周 期 后 的 输出 
状态 。 这 个 输出 模式 会 重复 吗 ? 如 果 会 ， 多 久 重 复 一 次 ? 
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6. 考虑 由 8 级 D 触 发 器 串联 构成 的 计数 器 /分 频 器 电路 。 假设 通过 一 个 触发 器 的 传输 延迟 是 25ns 。 
这 里 传输 延迟 是 指 从 时 钟 上 升 沿 出 现 到 输出 状态 改变 并 稳定 的 时 间 。 在 不 至 于 出 现下 一 个 
时 钟 信号 到 达 时 最 后 一 级 计数 器 还 在 改变 状态 的 前 提 下 ， 最 大 可 能 的 输入 时 钟 频率 是 多 
少 ? 你 可 以 假设 时 钟 输入 为 一 个 方 波 信号 。 

7.JK 触 发 器 最 常见 的 用 处 是 建造 同步 计数 电路 。 同 步 计 数 器 不 同 于 行 波 计数 器 ， 主 要 区 别 在 
于 时 钟 信号 并 行 地 输入 到 所 有 的 触发 器 ， 每 级 触发 器 根据 J、K 输 入 的 状态 或 者 翻转 或 者 保 
持 其 现 有 状态 。 因 此 ， 这 种 计数 器 比 行 波 计数 器 速度 快 得 多 。 请 使 用 式 触 发 器 设计 一 个 4 阶 
段 同步 计数 器 ， 类 似 于 图 4-6 中 显示 的 那 种。 提示 : 你 将 额外 需要 三 个 2- 输入 与 门 。 

8*. 下面 的 电路 被 称 为 带 并 行 载 入 功能 的 同步 计数 器 ， 它 在 计算 机 应 用 领域 非常 有 用 。 
LOAD/ COUNT 输 入 端 决定 了 这 个 电路 的 功能 是 同步 向 上 计数 器 还 是 并 行 载 人 寄存 器 例如 ， 
保持 LOAD/ COUNT 端 为 高 电压 ， 那么 时 钟 输 入 的 脉冲 将 D0 到 D3 的 值 载 和 区 触发 器 。 如 果 
LOAD/ COUNT 输 入 为 低 电压 ， 时 钟 输入 上 的 脉冲 则 使 计数 器 从 以 前 载 入 的 值 开始 向 上 计数 。 
这 样 ， 如果 数 据 值 (D0, D1, D2, D3) = (0, 1, 1, 0) 通过 为 高 的 LOAD/ COUNT 输 入 言 号 载 入 电路 ， 
那么 LOAD/ COUNT 变 低 后 的 下 一 个 脉冲 将 导致 开始 向 上 计数 ， 输出 Q0 到 Q3 变 为 (1, 1, 1,0)。 
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图 中 标 为 “开关 逻辑 ”(Switching Logic) 的 框 为 实现 并 行 载 人 同步 计数 器 基本 功能 的 
电路 。 请 设计 必要 的 门 电路 实现 这 个 设备 的 开关 逻辑 。 

提示 : 完成 前 面 的 习题 将 有 助 于 理解 这 个 电路 设计 的 要 求 。 一 旦 完成 了 习题 7， 为 这 个 
开关 逻辑 构造 真 值 表 和 卡 诺 图 就 比较 直接 了 。 





第 5 章 状态 机 简介 


学 习 目 标 

。 描述 状态 机 的 操作 ， 

"设计 一 个 简单 的 状态 机 ， 

* 解释 如 何 用 状态 机 控制 一 个 简单 微 处 理 器 的 指令 顺序 。 


5.1 引言 


有 关 计 算 机 系统 中 状态 机 的 话题 值得 我 们 做 出 更 多 的 讨论 。 既 然 这 样 说 了 ， 就 让 我 们 奋 
力 前 进 ， 以 获得 对 这 一 主题 的 了 解 。 你 可 能 从 来 都 没有 意识 到 ， 硬 件 设计 实现 和 软件 设计 实 
现 之 间 存 在 对 称 性 。 作 为 软件 开发 者 ， 你 已 经 熟悉 了 算法 是 什么 ， 你 可 能 在 其 他 的 计算 机 课 
程 中 已 经 写 了 很 多 不 同 的 算 靶 ， 你 甚至 也 许 在 某 门 单独 的 课程 中 学 习 了 算法 的 性 质 。 在 本 讲 
中 ， 我 们 将 了 解 如 何 只 用 硬件 而 不 是 用 一 组 C 或 C++ 指令 来 产生 算法 。 

算法 可 用 硬件 解决 ， 与 用 软件 同样 容易 ， 这 是 一 个 事实 。 例 如 ， 你 可 能 是 一 个 “游戏 玩 
家 ”， 正 在 你 的 PC 机 上 享受 视频 游戏 的 乐趣 。 你 知道 要 真正 进入 游戏 ， 就 需要 一 个 强 有 力 的 视 
频 卡 ， 能 够 高 速 地 生成 图 像 。 如 果 没 有 这 样 一 个 卡 ， 你 的 游戏 也 能 玩 ， 但 与 有 快速 视频 卡 时 
相 比 ， 它 会 很 慢 而 且 缺 少 真 实感 。 

另 一 个 例子 是 PC 机 上 的 56Kbps 的 调制 解 调 器 。 比 较 昂 贵 的 调制 解 调 器 是 全 自治 的 ， 价 格 
在 80 美 元 到 150 美 元 之 间 。 较 便宜 的 “win 调制解调器 ”必须 与 Windows 操 作 系 统一 起 使 用 ， 
而 且 需 要 足够 快 的 PC 以 保证 正确 运行 。 这 种 调制 解 调 器 的 价格 可 能 在 10 美 元 到 50 美 元 之 间 。 
两 种 调制 解 调 器 的 区 别 是 : 较 昂 贵 的 调制 解 调 器 是 在 硬件 中 做 数据 转换 ， 而 win 调制 解 调 器 则 
是 在 软件 中 做 数据 转换 。 

另 一 个 好 的 例子 可 见于 最 近 一 批 投入 市 场 的 低 价 格 激光 打印 机 。 前 一 代 的 激光 打印 机 包 
含 了 高 性 能 硬件 ， 用 以 将 输入 数据 流转 换 为 感光 鼓 上 的 激光 印记 图 案 ， 这 个 数据 转换 的 过 程 
称 为 光栅 化 〈rasterization) ， 类 似 于 在 CRT 屏 幕 上 生成 图 像 所 采用 的 方法 。 光 栅 化 是 由 激光 
打印 机 的 专用 硬件 处 理 的 ， 但 随 着 PC 的 计算 能 力 越 来 越 强 大 ， 将 光栅 化 过 程 移 回 到 PC 作为 
打印 机 驱动 程序 的 一 部 分 就 有 了 商业 意义 。 打 印 机 简单 地 将 到 来 的 光栅 数据 转换 为 感光 鼓 上 
的 激光 位 。 当 然 ， 你 只 有 采用 适合 的 软件 驱动 器 才能 使 用 打印 机 ， 打 印 机 不 能 作为 一 个 独立 
的 设备 。 

一 般 来 说 ， 一 个 算法 用 硬件 解决 比 用 软件 解决 要 快 得 多 ， 有 时 要 快 很 多 个 数量 级 。 目 前 ， 
已 经 发 展 出 一 种 产生 专用 集成 电路 (application-specific integrated circuit, ASIC) 的 方法 ， 作 
为 产生 算法 的 硬件 实现 的 一 种 途径 。 在 PC 中 的 视频 处 理 器 、 语 音 芯 片 、 调 制 解 调 器 芯片 都 是 
ASIC 的 例子 ， 但 它们 更 流行 于 工业 界 。 在 当今 很 多 的 产业 和 消费 应 用 中 ，ASIC 做 数据 处 理 和 
数据 操纵 ， 而 微 处 理 器 做 错误 处 理 和 初始 化 。 

在 前 面 章节 中 ， 我 们 接触 到 了 系统 状态 的 概念 。 触 发 器 的 引入 就 自然 产生 了 基于 状态 的 
系统 。 也 就 是 说 ， 一 个 装置 的 输出 不 仅 取 决 于 其 输入 ， 还 取决 于 其 输出 的 目前 状态 。 同 样 ， 
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我 们 还 介绍 了 这 样 的 系统 概念 : 只 有 出 现 同步 时 钟 信号 时 ， 状 态 才 能 改变 。 

我 们 将 要 接触 的 是 一 类 有 顺序 的 数字 系统 行为 。 我 们 很 快 就 会 看 到 ， 在 进行 从 存储 器 取 
出 指令 、 对 指令 译 码 、 执 行 指 令 、 将 结果 写 回 存储 器 ， 并 重新 开始 该 序列 行为 的 过 程 中 ， 计 
算 机 是 如 何 通过 有 限 步骤 的 序列 来 完成 这 些 工作 的 。 这 是 一 个 完美 的 时 序 过 程 的 例子 。 

计算 机 被 引领 走 过 这 一 序列 步 又 就 构成 了 状态 机 引擎 的 操作 。 该 引擎 可 如 我 们 在 本 章 例 
子 中 所 见 的 那样 由 存储 器 中 的 数据 控制 ， 也 可 以 如 我 们 早先 学 设计 时 所 看 到 的 由 组 合 逻 辑 控 
和 制 。 我 们 也 将 做 一 个 这 种 类 型 设计 的 例子 。 我 们 能 够 在 概念 上 描述 和 实现 成 为 同步 数字 系统 
的 任何 时 序 过 程 均 可 称 为 有 限 状 态 机 (finite state machine) '。 我 们 可 以 将 时 序 (有 限 状 态 ) 
机 定义 为 服从 如 下 一 组 要 求 的 模型 : 
。 它 可 处 于 某 有 限 状态 集合 5 中 的 一 个 状态 s， 
。 存 在 一 个 初始 状态 sb。， 它 是 集合 5 中 的 一 个 成 员 ， 
。 输 入 i 的 有 限 集合 7， 
。 次 态 函 数 d = d(s, i) 将 现 态 值 和 输入 映射 到 次 态 (在 S 中 ) ， 
。 输 出 函数 f= 了 (s, i)。 
上 述 表 达 是 对 我 们 直觉 上 已 知 东西 的 描述 吗 ? 图 4-20 显 示 了 4 位 二 进 制 计数 器 的 状态 迁移 
它 服从 我 们 对 于 有 限 状态 机 (FSM) 的 定义 吗 ? 
。 它 仅 可 能 在 一 个 具有 16 个 状态 的 集合 中 存在 ， 集 合 中 的 状态 标记 为 从 0000 到 1111。 这 16 
个 状态 就 定义 了 S。 
。 有 一 个 初始 状态 0000 、 该 状态 在 S 中 ， 可 通过 对 设备 的 初始 化 达到 ， 也 可 通过 一 序列 步 
又 达到 。 
。 在 该 例子 中 无 输入 ， 但 这 并 不 会 减弱 分 析 的 正确 性 。 
“次 态 函 数 取 决 于 现 态 。 
。 计 数 器 的 输出 取决 于 计数 器 的 现 态 。 
如 果 f 仅 是 其 现 态 的 函数 = f(s)， 就 像 4- 位 二 进 制 数 这 种 情况 ， 我 们 称 之 为 Moore 机 
(Moore machine)。 如 果 f 是 现 态 和 输入 的 函数 = 了 (5, 站 则 称 之 为 Mpaly 机 。 如 果 状 态 机 在 状 
态 s 接 收 到 输入 i， 则 它 要 进入 的 次 态 就 由 d = d(s, 站 来 决定 。 

我 们 可 将 FSM 原 理应 用 于 对 诸如 视频 卡 或 调制 解 调 器 等 过 程 性 问题 的 求解 。 当 我 们 采用 
这 些 方法 时 ， 我 们 所 描述 的 就 是 算法 状态 机 
(algorithmic state machine) 。 也 就 是 说 ， 我 们 
正在 将 FSM 设 计 的 方法 和 硬件 实现 技术 应 用 
于 算法 的 求解 。 

虽然 所 有 这 些 看 起 来 似乎 是 高 度 结构 化 
和 数学 化 的 确实 是 这 样 )， 但 通过 对 一 个 简 
单 的 时 序 过 程 实现 其 FSM， 我 们 或 许 能 对 该 
过 程 获得 一 些 感性 认识 。 

图 5-1 是 一 个 任意 硬件 算法 的 状态 图 。 一 
个 复位 脉冲 过 后 ， 系 统 初 始 化 到 状态 000。 了 暗 
灰 稍 头 显示 的 是 输入 变量 X=1 时 将 要 发 生 的 状 
态 迁 移 ， 而 亮 灰 箭 头 显示 的 是 X=0 时 将 要 发 生 
的 状态 迁移 。 这 样 ， 如 果 系 统 处 在 状态 011 且 图 5-1 一 个 任意 时 序 过 程 的 状态 图 
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X=0， 则 次 态 将 是 100。 但 若 X=1， 则 时 钟 到 来 后 次 态 将 成 为 010。 

图 5-2 是 这 个 算法 的 实现 方法 。 如 图 所 示 ， 电 路 的 输出 是 状态 变量 Aout、Bout 和 Cout。 注 
意 ， 状 态 000 就 意味 着 Aout=0，Bout=0，Cout=0。 这 些 变量 也 反馈 到 真 值 表 中 ， 成 为 输入 变 
量 ， 用 于 确定 下 一 个 时 钟 到 来 后 的 状态 迁移 。 在 这 个 例子 中 ， 我 们 将 把 状态 表 的 要 求 转移 到 
真 值 表 中 ， 然 后 以 组 合 逻 辑 来 产生 真 值 表 的 硬件 实现 。 当 组 合 逻 辑 和 D 触 发 器 结合 在 一 起 时 ， 
我 们 就 有 了 一 个 FSM， 它 复制 了 状态 图 。 所 以 ， 我 们 将 首先 完成 真 值 表 ， 然 后 用 图 技术 对 其 
进行 化 简 。 最 后 ， 我 们 将 用 硬件 来 实现 这 些 逻 辑 方程 。 
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图 5-2 图 5-1 时 序 过 程 的 实现 方法 。 真 值 表 将 被 转换 为 组 合 逻辑 


图 5-3 就 是 完成 的 真 值 表 。 首 先 要 问 的 是 :“ 它 有 用 吗 ? ”让 我 们 来 看 一 下 。 根 据 图 
5-1， RESET 信 号 一 过 ， 系 统 就 处 于 初始 状态 ， 从 该 状态 出 发 ， 既 可 以 在 X=1 时 进入 状态 101， 
也 可 以 在 X=0 时 进入 状态 011。 参 见 图 5-3 的 真 值 表 ， 我 们 看 到 当 Aout，Bout，Cout=000 时 ， 
若 X=0， 则 Anext，Bnext，Cnext=011， 若 X=1， 则 
Anext，Bnext，Cnext=101， 这 确实 与 状态 图 相符 。 

需要 注意 的 重要 一 点 是 状态 110 不 是 时 序 过 程 的 
组 成 部 分 。 在 真 值 表 中 ， 我 们 看 到 这 个 状态 表示 为 
XXX， 这 是 一 种 速记 方式 ， 表 示 该 状态 永远 不 会 达 
到 (如果 电 路 工作 正常 )。 我 们 能 做 的 就 是 保留 将 X 
替换 成 1 或 0 的 权利 ， 这 种 替换 可 能 会 简化 K 图 。 我 们 
能 这 样 做 的 原因 是 没有 其 他 状态 会 将 我 们 带 进 状 态 
110， 就 像 你 在 K 图 中 看 到 的 。 

在 开始 化 简 过 程 之 前 ， 我 们 应 该 停留 一 下 并 回 
忆 这 样 的 事实 ， 即 真 值 表 实 际 上 是 存储 器 内 容 的 映 
像 ， 它 能 够 提供 关于 时 序 过 程 的 电路 设计 。 图 5-4 显 
示 出 对 于 逻辑 设计 的 另 一 种 视角 。 这 里 ， 真 值 表 的 
输入 Ain、Bin、Cin 以 及 X 成 为 存储 器 的 4 个 地 址 输入 ， 图 5-3 图 5-1 时 序 过 程 例子 的 真 值 表 
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而 数据 输出 位 DATA0 到 DATA2 对 应 于 真 值 表 的 输出 变量 或 者 过 程 的 次 态 变量 。 


变量 和 简化 方程 的 K 图 显示 于 图 5-5。 
在 图 中 ，Anext 的 简化 方程 包括 一 个 XOR 项 ， 
该 项 的 加 入 是 为 了 进一步 化 简 A*X+A*XX 
这 样 的 项 。 是 否 可 做 进一步 的 化 简 是 很 容 
易 被 问 到 的 问题 。 显 然 ， 采 用 布尔 代数 法 
则 ， 对 某 些 项 可 重新 组 合 。 然 而 ， 从 门 的 
复杂 性 角度 看 ， 将 项 组 合 起 来 可 能 会 在 
实际 上 增加 复杂 性 ， 因 为 在 硬件 实现 中 
会 引进 额外 的 AND 门 ， 因 此 ， 对 于 最 好 
的 代数 解 会 导致 最 小 的 硬件 解 这 一 点 ， 
并 不 总 是 很 清楚 的 ， 会 有 一 些 另 外 的 因 





素 ， 如 : 可 得 到 多 少 具 有 所 需 输入 端 数 图 5-4 时 序 过 程 的 基于 存储 器 的 解决 方案 


量 的 门 ， 封 装 中 电路 其 他 地 方 所 需要 的 
额外 门 数 ， 等 等 。 

硬件 实现 如 图 $-6 所 示 。 注 意 D 触 发 器 的 2 输出 
是 如 何 用 作 真 值 表 的 反 相 门 的 ， 不 是 简单 地 用 NOTT 
来 产生 Anext、Bnext、Cnext 及 X 的 补 ，Q 输出 就 是 
便利 的 补 信号 来 源 。 

图 5-6 的 电路 满足 有 限 状 态 机 的 要 求 ， 即 满足 : 

。 有 一 个 包含 7 个 状态 的 集合 S$， 我 们 可 连续 地 按 

序 进行 访问 ， 两 个 状态 之 间 的 迁移 发 生 于 D 触 
发 器 输入 时 钟 的 上 升 沿 。 

。 我们 可 用 RESET 有 脉冲 确立 一 个 初始 状态 000， 
初始 状态 是 状态 集合 S 的 一 部 分 。 
系统 有 一 个 输入 X， 三 个 输出 Aout、Bout 及 
Conlt 。 

次 态 函 数 d = d(s, D 和 输出 函数 = f(s, 让 相同 。 
在 后 面 的 例子 中 ， 我 们 将 看 到 这 个 函数 全 然 不 
同 的 情况 。 

显然 ， 该 例子 纯粹 是 人 为 造 出 来 的 ， 而 不 是 真 
正 代 表 了 实际 的 数字 设计 (虽然 我 确信 你 能 在 剩余 
电子 产品 商店 买 到 一 些 零 件 ， 并 借助 简单 的 用 法 说 
明 ， 就 能 建造 起 电路 并 详尽 地 观察 状态 序列 ) 。 

这 很 有 趣 ! 让 我 们 看 另外 一 个 例子 ， 这 一 次 
我 们 将 做 一 个 可 能 有 实际 用 途 的 例子 。 我 们 考虑 
有 一 个 串 行 的 位 流 正 在 进入 系统 ， 设 想 我 们 需要 
检测 每 次 出 现 3 个 或 更 多 连续 1 的 出 现 。 我 一 时 不 
知道 为 什么 要 做 这 件 事 ， 但 若 给 一 些 时 间 ， 我 确 
信 你 能 想 出 有 这 种 电路 的 需求 。 图 5-7 就 是 该 电路 








Anext=C*(AOX)+C'(A*X+A*B*xX) 


Bnext=A*B+X*A*B+X*C*(B+A) 





Cnext=B*C+A*B+B*C*X+A*C*X 


图 5-5 变量 Anext、Bnext 及 Cnext 的 K 图 和 
简化 方程 





状态 机 疝 介 83 








图 5-6 图 5-1 中 时 序 过 程 的 硬件 实现 


这 里 我 们 有 4 个 状态 ,分 别 是 00、10、01 和 11。 篆 头 表示 在 时 钟 沿 发 生 的 状态 迁移 。 
疹 于 每 个 苗头 上 的 证 用 前 问 斜 线 分 隔 的 两 个 数字 。 第 一 个 数字 是 在 时 钟 上 升 沿 时 输入 位 
的 状态 ， 第 二 个 数字 是 输出 信号 T， 当 在 位 流 中 检测 到 三 个 或 更 多 个 连续 1 时 T 的 值 为 
TURE., 

在 本 例 中 ,我 们 所 采用 的 时 钟 信号 就 像 是 系统 用 来 同步 数据 位 流 的 时 钟 。 这 样 ， 在 每 
一 个 时 钟 上 升 沿 就 出 现 一 个 新 的 数据 位 。 每 次 出 现 一 个 0 位 ， 电 路 就 返回 到 00 状 态 ， 并 等 
待 1 的 到 来 。 第 一 个 1 的 到 来 使 电路 迁移 到 状态 10， 第 二 个 1 的 到 来 使 电路 迁移 到 状态 01。 
如 果 第 二 个 到 来 的 是 0， 则 电路 返回 到 状态 00。 但 是 ， 如 果 第 三 个 1 到 来 ， 电 路 就 迁移 到 状 
态 11，T 输 出 位 被 置 有 效 ， 显 示 已 发 现 三 个 连续 的 1 位 。 现 在 ， 只 要 到 来 的 位 是 1， 电 路 就 
保持 在 状态 11，T 也 为 1。 一 且 到 来 的 是 0， 电 路 就 返回 到 状态 00。 在 该 例子 中 ， 新 加 入 了 
输出 变量 位 T。 

图 5-8 显 示 了 电路 的 真 值 表 、K 图 以 及 简化 的 逻辑 方程 。 


AB AB AB AB 


Anext =X*(A+B) 


Bnext =X* (A+B) 





AB AB AB AB 


x| | | |i 

x_n |] 

图 57 一 个 用 于 在 串 行 位 流 中 检测 3 个 或 更 。 图 5-8 图 5-7 状 态 图 的 真 值 表 、K 图 以 及 简化 的 逻辑 方程 
多 个 1 连续 出 现 的 电路 的 状态 渤 移 图 








84 


条 了 全 


电路 图 显示 于 图 5-9 中 。 读 问题 也 是 一 个 FSM 的 例子 ， 其 中 输出 位 T 是 输入 和 组 合 逻辑 的 
函数 。 事 实 上 ， 状 态 位 A 和 B 对 输出 未 起 


任何 作用 。 显 然 ， 次 态 函 数 d = d(s, 让 和 输 
出 函数 f= 了 (s, 站 不 同 。 

另 一 个 有 趣 的 观察 是 FSM 实 际 上 实现 
了 算法 。 用 C、C++、 或 Java 写 一 个 算法 ， 
用 软件 模仿 这 个 硬件 电路 的 实现 ， 这 可 能 
不 会 花费 你 很 长 时 间 。 事 实 上 ， 我 们 已 经 
实现 了 一 个 算法 状态 机 (algorithmic state 
machine, ASM ) 。 


算法 状态 机 的 例子 ， 十字路 口交 通 控制 器 
让 我 们 遍历 一 下 (至少 一 次 ) 一 个 实 





图 5-9 图 5-7 状 态 迁 移 图 的 硬件 实现 


际 问 题 的 细节 ， 这 个 问题 是 可 用 算法 状态 机 ”3 解决 的 一 个 典型 问题 。 在 这 个 例子 中 ， 我 们 要 
考虑 的 是 为 一 个 典型 的 十 字 路 口 的 交通 灯 设 计 控 制 电路 。 图 5-10 显 示 出 十 字 路 口 的 示意 图 ， 


其 中 : 

。W = 西 面 车 辆 的 信号 灯 

。E = 东 面 车 辆 的 信号 灯 

。N = 北面 车 辆 的 信号 灯 

。S = 南面 车 辆 的 信号 灯 

由 于 南北 交通 是 一 个 繁忙 的 具有 4 条 车 
道 的 路 ， 而 东西 方向 的 路 只 有 2 条 车 道 ， 
我 们 就 可 假设 南北 方向 的 路 比 东西 方向 的 
路 有 更 高 的 交通 流 ， 所 以 ， 我 们 不 想 在 十 
字 路 口 停止 南北 交通 ， 除 非 在 东西 方向 有 
等 待 的 车 辆 。 例 如 ， 有 多 少 次 在 十 字 路 口 
面 对 红 灯 ， 你 坐 在 车 里 ， 也 许 还 有 二 三 十 
辆 其 他 的 车 ， 和 你 一 起 等 待 信号 灯 改 变 颜 
色 ， 而 同时 十 字 路 口 的 交叉 方向 却 没有 车 
辆 通过 了 呢 ? 但 我 在 这 里 脱离 主题 了 …… 

这 里 给 出 算法 的 伪 码 描述 : 

while {1) 

{ 

timer = 20 seconds; 

NS = green; 

EW = red; 

while ( timer != 0) 

wait; 


if (EW sensor != 0 ) 
{ 


图 5-10 具有 4 条 南北 方向 车 道 和 2 条 东西 方向 车 道 
的 交通 十 字 路 口 。 东 西方 向 的 路 具有 传 感 
器 来 检测 等 待 的 车 辆 
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timer = 5 seconds; 
NS = yellow; 
while ( timer != 0) 
wait; 
timer = 20 seconds; 
NS = red; 
EW = green; 
while ( timer != 0) 
wait; 
timer = 5 seconds; 
EW = yellow; 
while ( timer != 0) 
wait; 
} 
y 


注意 其 中 有 一 个 新 的 不 同 ， 就 是 时 间 的 不 同 。 我 们 要 在 南北 状态 存在 20 秒 ， 然 后 ， 如 果 
有 东西 方向 的 车 在 等 待 ， 就 要 通过 5 秒 黄 灯 后 ， 将 东西 方向 的 绿灯 打开 20 秒 。 

语句 while (1) 经 常 在 嵌入 式 系统 中 用 于 标识 程序 代码 中 永远 运行 的 部 分 。 一 旦 一 个 系 
统 (比如 打印 机 ) 被 初始 化 ， 它 就 将 永远 运行 (除非 你 关 掉 电 源 )。 

让 我 们 来 看 图 5-11 所 示 的 状态 迁移 图 。 东 西 交 通 传 感 器 的 状态 是 算法 的 一 个 输入 ， 它 
能 更 改 系 统 的 行为 。 我 们 可 利用 这 样 的 事实 来 表示 这 个 条 件 ， 即 一 旦 状态 机 处 于 NS 
GRN/EW RED 状 态 ， 就 有 两 条 可 行路 径 。 只 要 两 个 东西 方向 的 传感器 都 没有 检测 到 等 待 车 
辆 ， 交 通 控制 算法 就 将 保持 在 这 个 状态 。 然 而 ， 如 果 在 NS GRN 时 间 间 隔 结束 时 检测 到 一 个 
等 待 车 辆 ， 则 状态 机 就 迁移 到 状态 NS 
YEL/EW RED。 一 旦 处 于 此 状态 ， 算 法 在 
重新 进入 状态 NS GRN/EW RED 之 前 ， 就 
必须 顺序 进入 NS RED/EW GRN 和 NS 
RED/EW YEL， 不 存在 可 以 改变 这 个 顺序 
的 其 他 可 能 的 输入 。 

再 假设 我 们 能 照顾 到 时 间 要 求 ， 你 能 
轻易 地 将 此 算法 的 伪 代 码 改 为 C 或 C++ 语言 
的 实际 程序 。 当 然 ， 我 们 需要 提供 一 个 用 
于 驱动 信号 灯 和 定时 装置 的 IO 端口 ， 但 这 
些 都 是 简单 的 实现 细节 。 让 我 们 暂时 从 算 
法 状态 机 设计 中 转移 一 下 ， 来 介绍 一 个 新 
的 概念 。 图 5-12 为 我 们 展示 了 表示 成 时 序 图 5-11 交通 十 字 路 口 的 状态 迁移 图 
图 的 输出 状态 。 这 个 时 序 图 向 我 们 展示 了 用 于 控制 信号 灯 的 输入 信号 的 状态 随时 间 的 变化 情 
况 。 注 意 ， 在 图 5-12 中 ， 横 轴 采 用 的 是 5 秒 的 刻度 ， 这 仅仅 是 表明 输出 只 在 5 秒 刻 度 的 时 刻 才 
变化 。 

图 5-12 的 时 序 图 代表 了 对 系统 的 另外 一 个 视角 。 事 实 上 ， 这 就 是 在 逻辑 分 析 仪 的 屏幕 
上 所 应 看 到 的 对 交通 灯 驱 动 电路 的 控制 器 输出 。 这 种 视角 是 重要 的 ， 因 为 它 为 我 们 引入 了 
另 一 个 重要 概念 ， 就 是 将 系统 状态 表示 成 一 组 状态 向 量 (state vector) 的 思想 。 状 态 向 量 
就 是 系统 所 处 的 输入 和 输出 的 所 有 可 能 状态 组 合 。 这 样 ， 如 果 你 生成 了 所 有 这 些 向 量 的 表 ， 
你 就 有 了 表示 系统 所 有 可 能 状态 的 另 一 种 方式 。 图 5-13 就 是 图 5-12 时 序 图 的 状态 向 量 集 的 
表示 。 
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NS RED 1 
0 
NS YELLOW 1 
0 
NS GREEN “1 
0 
EW RED 1 
0 
EW YELLOW 1 
0 
EWGREEN 1 
0 





时 间 ， 秒 


图 5-12 交通 信号 灯 运 行 序列 表示 为 时 序 图 


0 1 0 0 0 0 1 21 

5 1 0 0 0 0 1 21 

10 1 0 0 0 0 1 21 

15 1 0 0 0 0 1 21 
20 0 1 0 0 0 1 11 
25 0 0 1 1 0 0 oC 
30 0 0 1 1 0 0 oC 
35 0 0 1 1 0 0 0C 
40 0 0 1 1 0 0 0C 
45 0 0 1 0 1 0 0A 
50 1 0 0 0 0 1 21 


图 5-13 将 时 序 图 表示 成 一 组 状态 向 量 。 右 侧 的 十 六 进 制 状态 表示 是 6 个 灯 信 号 的 各 个 
二 进 制 状态 总 体 的 速记 方式 ， 因 此 ， 十 六 进 制 数 字 作为 数字 本 身 没有 实际 意义 


在 每 个 时 钟 迁移 时 ， 系 统 的 状态 可 用 二 进 制 向 量 集合 或 十 六 进 制 向 量 集合 来 描述 。 这 里 
我 们 必须 小 心 一 点 ， 图 5-13 的 每 个 十 六 进 制 状态 表示 不 应 与 数字 相 混 消 。 它 不 是 数字 ， 而 是 
一 些 单独 位 的 汇集 ， 表 示 成 位 的 总 体 ， 换 名 话说， 就 是 状态 向 量 。 

如 你 所 见 ， 十 六 进 制 表示 在 为 交通 控制 器 生成 实际 存储 器 映像 方面 是 便利 的 ， 但 是 ， 更 
为 准确 和 有 意义 的 表示 应 该 是 用 二 进 制 向 量 表 示 ， 使 用 十 六 进 制 的 好 处 仅仅 是 很 便利 。 

现在 ， 让 我 们 开始 对 控制 器 的 实际 设计 过 程 。 作 为 第 一 次 设计 ， 我 们 将 忽略 东西 交通 传 
感 器 而 仅 考虑 一 个 简单 的 模型 ， 该 模型 在 每 个 方向 上 给 20 秒 的 时 间 ， 黄 灯 给 5 秒 时 间 。 关 注 这 
些 问题 会 更 好 一 些 。 图 5-14 显 示 出 转换 成 状态 变量 的 简化 算法 ， 我 们 按 每 个 状态 的 持续 时 间 
是 5 秒 来 重新 绘制 了 该 图 。 通 过 增加 状态 数量 ， 即 使 若干 状态 “似乎 ”表示 相同 条 件 ， 我 们 也 
能 将 问题 转化 成 相同 时 间 间 隔 的 问题 。 实 际 上 ， 那 4 个 表示 20 秒 时 间 间 隔 的 状态 是 不 一 样 的 ， 
它们 仅仅 是 有 相同 的 输出 函数 。 

现在 ， 我 们 已 经 给 了 每 个 状态 一 个 唯一 的 数字 标识 ， 从 0000 到 1001， 即 0H 到 9H。 这 看 起 
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来 也 许 像 是 存储 器 地 址 ， 但 我 对 此 表示 绒 默 ， 我 要 到 最 后 再 加 以 说 明 。 让 我 们 规定 输出 和 每 
一 位 的 二 进 制 权 值 ， 这 仅 是 为 方便 起 见 ， 我 们 将 强行 这 样 做。 





图 5-14 将 十 字 路 口交 通 算法 表示 成 一 组 状态 变量 。 每 个 状态 按 序 用 数字 标记 ， 状 态 持续 时 间 是 5 秒 
考虑 状态 0000 (0Hex) 的 6 个 输出 : 


。 南北 红 灯 亮 : NSR， 即 数据 位 0 (D0) =1 
。 南北 黄 灯 灭 : NSY， 即 数据 位 1 (D1) =0 
。 南北 绿灯 灭 : NSG， 即 数据 位 2 (D2) =0 
。 东西 红 灯 灭 : EWG， 即 数据 位 3 (D3) =0 
。 东西 黄 灯 灭 : EWY， 即 数据 位 4 (D4) =0 
。 东西 绿灯 亮 : EWG， 即 数据 位 5 (D5) =1 


这 样 ， 状 态 0000 的 状态 变量 就 是 100001， 即 状态 Ohex = 21hex。 我 们 还 用 集 总 的 数据 位 (data 
bit) 表示 状态 变量 的 总 和 ， 而 且 ， 给 控制 信号 灯 的 每 个 位 一 个 总 体 的 标识 ， 使 得 我 们 可 以 将 
它们 作为 一 个 组 而 不 是 作为 一 个 单独 的 标识 来 处 理 ， 这 将 是 便利 的 。 然 而 ， 我 们 应 该 记 住 每 
个 输出 变量 实际 上 是 与 其 他 输出 变量 相互 独立 的 。 例 如 ， 在 这 个 例子 中 ， 在 状态 值 上 加 一 个 
数字 (21hex) 并 没有 逻辑 上 的 意义 。 下 一 步 就 是 将 我 们 的 规范 定义 转换 成 真 值 表 。 

还 记得 我 们 早先 见 过 的 32 位 存储 器 阵列 吗 ? 我 们 再 考虑 一 下 ， 但 这 一 次 我 们 将 输出 数 扩 
展 到 6 个 ， 以 对 应 于 交通 信号 的 6 个 输出 。 这 样 就 需要 一 个 具有 96 个 存储 单元 的 存储 器 ， 排 列 
成 16x 16。 图 5-15 显 示 出 这 个 项 目的 存储 器 ( 真 值 表 ) 布局 图 。 














D0 
D1 
D2 
D3 
D4 上 


D5 


时 钟 频率 = 0.2Hz 16 x 6 存储 器 阵列 


图 5-15 具有 存储 寄存 器 来 提供 定 序 机 制 的 状态 机 。 该 电路 仍 缺 乏 对 系统 进行 
状态 转换 的 定 序 机 制 以 及 东西 车 辆 有 等 待 时 改变 算法 的 机 制 
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时 钟 生 成 器 在 系统 的 其 他 地 方 。 我 们 迄今 一 直 在 讨论 的 时 钟 频率 是 0.2Hz (每 5 秒 一 个 周 
期 )， 这 个 频率 绝对 是 太 慢 了 ， 但 这 是 该 例子 所 需要 的 速度 。 作 为 另 一 个 选择 ， 我 们 考虑 将 时 
钟 周期 提高 到 1Hz 的 可 能 性 ， 这 会 明显 增加 系统 状态 的 数量 ， 但 我 们 可 用 其 他 方式 来 重新 设计 
系统 以 解决 这 个 问题 。 增 加 系统 状态 数量 的 一 个 优势 是 减少 了 系统 的 反应 时 间 。 

假设 我 们 想 将 一 个 紧急 车 辆 检测 器 (emergency vehicle detector) 加 入 到 十 字 路 口中 ， 这 
是 一 个 光敏 装置 ， 用 于 检测 紧急 车 辆 顶部 的 闪光 灯 。 如 果 一 个 警车 正 以 每 小 时 100 公 里 ( 约 每 
秒 28 米 ) 的 速度 冲 向 十 字 路 口 ， 则 在 十 字 路 口 的 所 有 灯 变 红 以 前 ， 该 警车 能 行驶 约 139 米 (在 
5 秒 的 时 钟 周期 内 ) 。 显 然 ， 我 们 的 十 字 路 口交 通 算法 还 有 改进 的 余地 。 

D 寄 存 器 的 输出 值 就 是 6 个 存储 单元 的 地 址 ， 它 决定 了 时 钟 脉冲 上 升 沿 到 来 之 后 ， 系 统 次 
态 的 数据 。 我 们 可 以 通过 创建 状态 表 (state table) 来 概括 这 些 数据 ， 这 仅仅 是 将 所 有 部 分 信 
息 汇 总 起 来 的 简便 方式 。 记 住 我 们 仍 需 要 加 入 一 种 机 制 来 为 系统 状态 之 间 的 迁移 进行 定 序 。 

图 5-16 就 是 初始 设计 的 状态 表 。 我 们 称 之 为 初始 设计 是 因为 我 们 还 需要 加 入 定 序 机 制 ， 
我 们 不 久 就 会 处 及 到 这 个 问题 。 参 见 图 $-16， 你 就 会 明白 我 们 已 经 泄露 了 秘密 ， 状 态 的 数字 
标识 0000 到 1001 确 实 就 是 即将 成 为 设计 真 值 表 的 ROM (read only memory) 的 地 址 。 你 可 能 
已 经 从 你 PC 的 BIOS ROM 那 里 熟悉 了 “ROM” 这 个 术语 , ROM 就 是 一 个 存储 器 件 ， 可 预 编程 ， 
即使 电源 关 掉 后 数据 也 能 保持 ， 这 正 是 我 们 的 交通 控制 器 所 需要 的 。 


全 
@ 
8 
8 
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0 
0 
0 
0 
0 
0 
0 
0 
1 
1 
1 
1 
1 
1 
1 
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-22200002+22O000 
+2202002+2002200 
2~O20-002040202020 
xXxXxxXxXXxXoooooo22 
xXxxxxxXooooo-o000 
久久 多 XXX 一 一 一 一 一 口 口 吕 oo 
XXX 久久 关口 一 一 一 环 口 口 口 口 口 
Xxxxxx-~oOoo0ooooo0oo0o 
XxxxxXxXoOooooOoO，-22 





图 5-16 交通 控制 器 的 状态 表 ， 显 示 出 状态 变量 (ROM 地 址 ) 和 每 个 ROM 地 址 包含 的 数据 。 
标识 为 “X” 的 值 是 指 “ 无 关 项 ”， 因 为 状态 机 永远 不 会 进入 到 这 些 状态 


注意 我 们 的 ROM 中 实际 上 有 一 些 没有 存储 任何 数据 的 存储 单元 ， 这 些 就 是 从 地 址 0Ahex 
到 地 址 9OFhex 中 的 “无 关 项 ”(don't care)， 这 是 因为 我 们 的 设计 总 共 只 有 10 个 有 效 状 态 
(00hex 到 地 址 09hex)。 虽 然 存储 器 中 有 这 些 额 外 的 状态 ， 但 只 要 我 们 的 定 序 器 不 将 我 们 引入 
到 这 些 状态 ， 我 们 就 不 会 为 此 操心 。 

加 入 状态 定 序 机 制 是 一 个 相当 简单 的 过 程 ， 我 们 要 做 的 就 是 增加 状态 表 中 数据 输出 的 数 
量 ， 这 些 输出 将 要 反馈 到 D 存 储 寄存 器 。 这 样 ， 我 们 就 推广 了 状态 机 的 概念 ， 表 明 将 所 有 输出 





状态 规章 介 89 


反馈 到 输入 是 不 必要 的 ， 我 们 只 需要 将 足够 的 输出 反馈 到 输入 ， 用 来 为 状态 机 提供 定 序 机 制 。 
我 们 称 这 些 额外 的 输出 为 激励 输出 (excitation output) ， 因 为 它们 的 功能 是 为 状态 机 提供 定 序 
(激励 ) 机 制 。 图 5-17 显 示 出 新 的 设计 。 


NSR 
NSY 
NSG 
EWR 
EWY 
EWG 


D 寄 存 器 - 
16x10 


8 
存储 器 阵列 
时 钟 频 率 = 0.2Hz DB 





图 5-17 状态 机 在 ROM 中 加 入 了 额外 的 数据 位 ， 用 来 提供 对 状态 的 定 序 机 制 


现在 ， 就 有 必要 扩展 ROM 中 数据 输出 的 位 数 ， 以 便 为 定 序 系统 提供 对 D 寄 存 器 的 反馈 。 
ROM 仍 有 同样 数量 的 存储 地 址 ， 但 我 们 已 经 加 入 4 个 输出 位 ， 这 样 ，ROM 的 每 个 地 址 就 有 10 [97 
个 二 进 制 位 。 图 5-18 显 示 出 扩展 的 状态 表 。 


现 态 ROM 地 址 
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XxxxxXxooo~--+-2O00 
xxxxxxooo0o~-0o0+-0 
XxxxxXxo--0200-2-020+~ 
XXXXxXXxeooeooeooe= 一 一 一 
xxxxxxooooo-o000 |& 
XXX 又 义 冯 一 一 一 一 一 品 ODOD 
xXxxxXxXo---2E0000 
xxxxxx-~cooo0ooo0oo0o00 
xxxxxxoooooco- -~ 


0 
0 
0 
0 
0 
0 
0 
1 
1 
0 
Xx 
X 
x 
X 
X 
xX 


图 5-18 修改 后 的 状态 表 ， 现在 包含 了 额外 的 用 于 定 序 的 数据 位 


最 后 ， 我 们 现在 就 有 条 件 回 过 头 来 考虑 为 东西 交通 加 入 额外 输入 的 问题 了 ， 我 们 迄今 
一 直 忽略 这 个 问题 。 让 我 们 更 新 一 下 记忆 (已 经 过 去 很 长 时 间 了 ) ， 回 顾 一 下 我 们 以 前 设 
计 的 算法 。 图 5-19 给 出 了 我 们 曾 设计 和 修改 过 的 状态 图 ， 对 每 个 状态 我 们 可 采用 5 秒 时 钟 
周期 。 





图 5-19 状态 机 的 状态 迁移 图 ， 包 含 了 为 等 待 东西 车 辆 而 设 的 输入 
这 个 新 的 加 入 使 我 们 得 到 了 如 图 5-20 所 示 的 状态 机 设计 。 


64x 10 
存储 器 阵列 


时 钟 频率 = 0.2Hz 





图 5-20 具有 独立 输入 的 状态 机 
两 个 独立 的 输入 ET 和 WT 的 加 入 是 极其 重要 的 ， 它们 分 别 表 示 了 在 路 内 等 待 东 面 和 西 面 车 
辆 的 传感器 ， 这 两 个 独立 输入 的 条 件 能 影响 状态 机 的 定 序 。 这 样 ， 我 们 就 向 算法 状态 机 中 加 
入 了 全 新 的 内 容 : 响应 输入 数据 的 变化 并 改变 状态 流向 的 能 力 。 你 还 认得 这 个 新 特征 吗 ? 你 
应 该 记得 ， 它 称 为 计算 机 。 
独立 输入 的 加 入 能 够 为 状态 机 定义 新 的 状态 ， 状态 机 开始 变 得 像 一 个 决策 支持 设备 。 当 
然 ， 它 不 是 真正 做 决策 ， 因 为 我 们 已 经 对 它 精确 地 进行 了 预 编程 ， 规定 它 如 何 响应 新 的 数据 。 





机 有 个 


计算 机 的 状态 机 要 比 这 个 简单 的 状态 机 复杂 几 千 倍 ， 但 你 正 逐 渐 了 解 它 。 我 们 称 微 处 理 器 的 
状态 转换 表 (ROM) 为 微 代码 (microcode)， 是 微 代 码 给 了 计算 机 以 个 性 。 计 算 机 的 指令 集 
体系 结构 (instruction set architecture, ISA) 是 由 微 代 码 所 定义 的 。 

当 计 算 机 从 存储 器 中 取出 一 条 指令 时 ， 代 表 指 令 的 位 模式 就 是 输入 到 微 代码 ROM 的 外 部 
输入 组 合 ， 这 个 模式 确立 了 解释 和 执行 该 指令 所 要 求 的 步骤 序列 。 你 曾 想 知 道 为 什么 会 遇 到 
臭名 昭著 的 蓝屏 死机 (Blue Screen of Death) 吗 ? 有 时 (不 总 是 ) 这 可 能 是 由 一 个 漂浮 不 定 
的 指针 使 程序 从 存储 器 中 的 非法 区 域 取 指令 而 引起 的 。 这 里 的 位 模式 就 可 能 只 是 数据 值 或 垃 
圾 ， 而 不 是 合法 指令 的 位 模式 。 由 于 微 代 码 不 能 解释 这 个 模式 ， 处 理 器 就 通知 操作 系统 ， 程 
序 自己 停止 。 无论 如 何 ， 让 我 们 还 是 回 到 手头 的 问题 上 。 

让 我 们 重新 审视 状态 ROM。 我 们 已 经 又 加 入 了 两 个 输入 ， 因 此 可 能 的 地 址 组 合 的 数量 就 
上 升 到 了 64 个 。 现 在 ， 我 们 的 状态 ROM 就 有 64 个 位 置 ， 每 个 位 置 有 10 位 宽 的 数据 ， 因 此 我 们 
的 简单 交通 系统 控制 器 已 有 640 个 存储 单元 。 这 就 不 难 理解 为 什么 现代 计算 机 的 微 代码 引擎 有 
数 百 万 的 存储 器 单元 了 。 图 5-21 是 ROM 的 状态 表 ， 包 含 了 所 有 细节 。 

















状态 wr ET - 次 态 输出 
A5 M A3 A2 Al A0 D9 D8 D7 D6 D5 DM p3 D2 pl p0 
0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 
0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 1 
0 0 0 0 1 0 0 0 0 1 1 0 0 0 0 1 
0 0 0 0 1 1 0 0 0 1 1 0 0 0 0 1 
0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 | 
0 0 0 1 0 1 0 0 1 0 1 0 0 0 0 1 
0 0 0 1 1 0 0 0 1 0 1 0 0 0 0 1 
0 0 0 1 1 1 0 0 1 0 1 0 0 0 0 1 
0 0 1 0 0 0 0 0 1 1 1 0 0 0 0 1 
0 0 1 0 0 1 0 0 1 1 1 0 0 0 0 1 
0 0 1 0 1 0 0 0 1 1 1 0 0 0 0 1 
0 0 1 0 1 1 0 0 1 1 1 0 0 0 0 1 
0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 1 
0 0 1 1 0 1 0 1 0 0 1 0 0 0 0 1 
0 0 1 1 1 0 0 1 0 0 1 0 0 0 0 1 
0 0 1 1 1 1 0 1 0 0 1 0 0 0 0 1 
0 1 0 0 0 0 0 1 0 1 0 1 0 0 0 1 
0 1 0 0 0 1 0 1 0 1 0 1 0 0 0 1 
0 1 0 0 1 0 0 1 0 1 0 1 0 0 0 1 
0 1 0 0 1 1 0 1 0 1 0 1 0 0 0 1 
0 1 0 1 0 0 0 1 1 0 0 0 1 1 0 0 
0 1 0 1 0 1 0 1 1 0 0 0 1 1 0 0 
0 1 0 1 1 0 0 1 1 0 0 0 1 1 0 0 
0 1 0 1 1 1 0 1 1 0 0 0 1 1 0 0 
0 1 1 0 0 0 0 1 1 1 0 0 1 1 0 0 
0 1 1 0 0 1 0 1 1 1 0 0 1 1 0 0 
0 1 1 0 1 0 0 1 1 1 0 0 1 1 0 0 
0 1 1 0 1 1 0 1 1 1 0 0 1 1 0 0 


图 5-21 交通 控制 器 ROM 的 状态 表 。 注 意 从 状态 1010 开 始 的 无 用 状态 有 一 个 09H 的 数据 输出 ， 对 应 于 南北 
红 灯 和 东西 红 灯 打开 。 这 对 于 系统 进入 非法 状态 这 样 的 不 可 靠 事件 提供 了 一 个 安全 特性 
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图 $-21 ( 续 ) 
， 过 程 的 下 一 个 逻辑 步骤 就 是 将 防备 紧急 车 辆 的 过 程 放 回 到 我 们 的 设计 中 。 这 将 在 


设计 中 再 加 入 一 个 输入 ， 使 得 ROM 有 7 个 地 址 位 。 为 什么 到 此 就 停止 了 呢 ? 我 们 还 可 以 为 南 
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北 车 辆 加 入 一 个 左 转 的 信号 ， 这 将 至 少 再 加 入 一 个 输出 (NS 转向 灯 ) 和 一 个 输入 (NS 转向 车 
辆 等 待 ，NST) 。 如 果 我 们 继续 为 这 种 更 复杂 的 情况 设计 算法 ， 我 们 会 看 到 系统 的 状态 数 增 加 
到 超过 16， 所 以 我 们 需要 增加 一 个 输出 ， 并 反馈 到 输入 用 来 定 序 。 这 就 使 ROM 有 总 共 11 个 输 
出 和 8 个 输入 。 如 果 你 在 下 雨 的 周末 没有 任何 事 可 做 ， 为 什么 不 为 这 样 一 个 真实 的 交通 十 字 路 
口 制作 一 个 状态 表 呢 ? 我 把 这 作为 一 个 可 选择 的 、 但 又 是 有 教 益 的 习题 留 给 有 积极 性 的 学 生 。 

图 5-22 显 示 出 了 电路 的 重要 组 件 和 数据 通路 ， 并 且 没 有 陷入 使 电路 实际 运行 所 要 考虑 的 很 多 细 
节 。 振 荡 器 模块 产生 0.2Hz 的 时 钟 流 ， 我 们 需要 它 为 状态 机 定 序 。 八 进 制 的 D 触 发 器 是 一 个 集成 电 
路 构件 块 ， 它 在 具有 一 个 共同 时 钟 输入 的 单一 封装 中 包含 8 个 D 触 发 器 ， 因 此 ， 所 有 8 个 触发 器 总 是 
在 同一 个 时 钟 上 升 沿 触发 。 





图 5-22 交通 十 字 路 口 控 制 器 的 简化 示意 图 


另外 两 个 器 件 是 交通 控制 器 的 心脏 ， 它 们 包含 了 我 们 设计 的 用 来 实现 算法 状态 机 的 ROM 
代码 。 采 用 两 个 独立 ROM 的 原因 是 我 们 需要 10 个 输出 ， 而 大 多 数 商 业 上 可 得 到 的 ROM 只 有 8 个 
输出 ， 所 以 我 们 需要 将 设计 在 两 个 ROM 之 间 进 行 划 分 。 为 了 方便 ， 上 面 ROM 的 6 个 输出 用 于 控 
制 信号 灯 ， 下 面 ROM 的 4 个 输出 用 于 定 序 。 你 可 以 看 到 下 面 ROM 的 4 个 输出 又 返回 成 为 D 触 发 
器 的 输入 。 这 就 清楚 地 示意 出 定 序 函 数 4 (s, i) 和 输出 函数 f(s,i) 的 不 同 。 

该 例子 中 所 使 用 的 ROM 每 个 的 容量 是 16K 位 ， 以 2K x 8 组 织 。 由 于 我 们 在 每 个 ROM 中 总 
共 只 使 用 了 64 个 地 址 ， 你 可 能 会 认为 在 计算 机 体系 结构 的 历史 上 这 不 是 最 伟大 的 工程 解决 方 
案 。 然 而 ， 存 储 器 相对 来 说 不 昂贵 ， 而 且 在 这 个 特殊 的 例子 中 ， 一 个 具有 16K 存 储 单元 的 
ROM 并 不 比 一 个 小 得 多 的 ROM 更 昂贵 。 

在 继续 讨论 之 前 ， 让 我 们 总 结 一 下 我 们 学 过 的 有 关 状 态 机 的 知识 ， 并 用 这 些 原理 解释 计 
算 机 是 如 何 工作 的 。 图 5-23 显 示 出 数字 计算 机 的 基本 定 序 机 制 ， 你 可 以 清楚 地 看 到 Mealy 机 的 
元 件 。 为 方便 ， 我 们 省 略 了 计算 机 内 部 很 多 的 其 他 东西 ， 它 们 只 是 连接 到 微 定 序 器 ROM 的 输 
出 端 。 微 定 序 器 的 外 部 输入 包括 机 器 语言 指令 以 及 能 影响 程序 执行 流 的 所 有 其 他 输入 。 
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假如 我 们 想 在 计算 机 的 内 部 将 两 个 数字 相 加 。 


运用 新 学 到 的 状态 机 设计 的 
知识 ， 我 们 该 如 何 做 这 件 事 昵 ? 外 部 输入 
假设 我 们 想 将 两 个 4 位 的 数 相 加 。 上 > 
在 计算 机 中 将 两 个 数 相 加 的 电路 


为 算术 和 逻辑 单元 (arithmetic 
and logic unit, ALU) 中 。 实 际 上 ， 
你 对 生成 ALU 的 基本 构建 块 的 数 
字 设 计 知 识 已 经 知道 得 足够 多 了 。 
基本 的 加 法 电路 有 3 个 输入 (A、 
B 及 Carry In) 和 2 个 输出 (SUM 和 
Carry Out)。 我 们 可 将 基本 的 2- 位 





图 5-23 广义 的 时 序数 字 机 











加 法 器 电路 的 行为 总 结 并 显示 在 
表 5-1 的 真 值 表 中 。 
表 5-1 2- 位 加 法 器 电路 的 真 值 表 

A B Cin Sum Cout 
0 0 0 0 0 
1 0 0 1 0 
0 1 0 1 0 
1 1 0 0 1 
0 0 1 1 0 
1 0 1 0 1 
0 1 1 0 1 
1 1 1 1 1 


一 旦 设计 了 这 个 电路 并 布置 了 门 ， 如 果 回 顾 一 下 XOR 门 的 设计 ， 你 将 很 快 发 现 你 能 极 大 
地 简化 这 个 电路 。 正 如 你 在 真 值 表 中 所 看 到 的 ， 加 法 器 的 每 一 级 只 是 简单 地 将 两 个 输入 相 加 
再 加 上 前 面 一 级 的 进位 ， 并 生成 一 
个 和 以 及 一 个 到 下 一 级 的 进位 。 如 3 be 1 20 
果 我 们 想 将 两 个 32 位 数 (整数) 加 


在 一 起 ， 我 们 就 要 有 32 个 这 样 的 加 
[ho 


既然 知道 了 如 何 将 数字 相 加 ， 
让 我 们 再 看 一 下 状态 机 如 何 对 操作 
进行 定 序 , 使 数字 实际 地 加 在 一 起 ， 
得 到 结果 并 存 起 来 。 图 5-25 就 是 这 
个 操作 序列 的 示意 图 。 图 5-24 将 两 个 数字 相 加 

在 这 个 特殊 的 例子 中 ,完成 加 法 需要 5 个 时 钟 周 期 。 注 意 我 们 已 经 略 去 了 一 些 预 备 的 步骤 ， 
例如 先 要 对 加 法 指令 进行 译 码 才能 转 到 这 里 相 加 ， 还 有 就 是 如 何 先 将 要 加 的 数字 放 到 寄存 器 
中 。 我 们 显然 在 隐藏 一 些 材料 。 我 们 将 在 后 面 的 一 章 里 全 面 和 详细 地 讨论 这 个 问题 ， 现 在 我 
们 就 只 关注 概念 。 我 们 按 如 下 步 又 进行 这 个 过 程 ; 


A3 B3 A2 B2 Al1 Bf A Bo 
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a 
图 5-25 两 个 4 位 数 相 加 的 状态 机 序列 


1. 将 存 有 第 一 个 操作 数 A0...A3 的 存储 寄存 器 连接 到 加 法 器 电路 ， 使 得 加 法 器 的 A 输 
入 端 能 看 到 第 一 个 操作 数 。 

2. 然后 将 存 有 第 二 个 操作 数 B0...B3 的 存储 寄存 器 连接 到 加 法 器 。 

3. 一 段 适当 的 传播 延迟 之 后 (一 旦 B 输 入 已 经 稳定 )， 结 果 就 出 现在 加 法 器 的 输出 端 。 

4. 进位 输出 位 的 状态 存储 在 适当 的 寄存 器 中 。 你 很 快 就 会 看 到 ， 我 们 还 要 存 一 些 其 
他 的 结果 。 例 如 ， 如 果 相 加 的 结果 为 零 ， 我 们 也 要 存储 这 个 信息 。 

5. 将 相 加 的 和 存储 在 一 个 输出 寄存 器 中 以 备 将 来 使 用 。 
我 们 总 结 一 下 我 们 学 过 的 有 关 状 态 机 的 知识 : 
“次 态 取决 于 : 现 态 、 任 何 存储 寄存 器 的 输入 ， 以 及 任何 返回 到 存储 寄存 器 输入 的 输出 。 
“DD 型 寄存 器 由 D 型 触发 器 组 成 ， 其 作用 是 在 时 钟 边沿 上 对 状态 机 进行 同步 。 时 钟 的 转换 
时 间 必 须 远 快 于 状态 机 发 生变 化 所 需 时 间 ， 这 样 才能 同步 状态 机 ， 防 止 电路 失控 。 
。ASM 的 流 图 或 状态 图 就 是 正在 实现 的 算法 。 
“基于 ROM 的 状态 表 是 实现 用 于 设计 的 真 值 表 的 一 种 方式 。 我 们 也 可 以 遵循 设计 步骤， 
利用 真 值 表 为 每 个 输出 变量 建立 积 (最 小 项 ) 和 (sum of product) 逻辑 方程 。 一 日 有 
了 真 值 表 ， 我 们 就 能 生成 卡 诺 图 ， 通 过 卡 诺 图 就 能 生成 简化 的 电路 门 设计 。 
算法 状态 机 是 几乎 所 有 目前 的 计算 引擎 的 基础 。 现 代 计算 机 的 指令 集体 系 结构 由 其 内 部 


的 微 代 码 ROM 所 决定 ， 它 实现 了 状态 机 。 处 理 器 如 何 按 序 人 遍历 一 系列 状态 由 如 下 因素 决定 ， 


“执行 的 指令 

* 内 部 寄存 器 的 内 容 

“算术 和 逻辑 操作 的 结果 

“所 采用 的 存储 器 访问 模式 

“异步 的 内 部 或 外 部 事件 (中断 、RESET、 错 误 条 件 ) 
图 5-26 显 示 出 示意 图 。 





图 5-26 一 个 简单 微 处 理 器 中 的 状态 定 序 





un 
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5.2 现代 硬件 设计 方法 


Mead 和 Conway 为 超大 规模 集成 (VLSI) 电路 的 设计 提出 了 一 种 新 的 方法 。 基 于 对 复杂 
集成 电路 的 一 种 自 顶 向 下 的 开发 方法 ， 他 们 描述 了 一 个 结构 化 的 设计 系统 。 他 们 写 到 , 
VLSI 系统 的 结构 化 设计 方法 可 开始 于 在 一 个 层次 结构 中 将 本 章 所 提出 的 概念 合 
并 在 一 起 。 然 后 ， 设 计 以 一 种 “ 自 顶 向 下 ”的 方式 进行 ， 但 设计 师 要 对 相继 的 低层 
的 层次 结构 有 完全 的 了 解 。 
开始 时 ， 我 们 将 数字 处 理 系 统 规 划 成 寄存 器 到 寄存 器 的 数据 传输 路 径 的 组 合 ， 

由 有 限 状 态 机 控制 。 然 后 ， 对 所 有 子 系统 模块 的 几何 形状 、 相 对 尺寸 以 及 互 连 拓扑 

关系 一 起 进行 规划 ， 使 得 所 有 模块 安 适 地 融合 在 一 起 ， 并 使 随机 互 连 布 线 所 花费 的 

空间 和 时 间 最 小 化 …… 

如 果 我 们 将 每 个 层次 的 每 个 模块 都 看 作 是 一 个 有 限 状 态 机 或 由 有 限 状 态 机 控制 

的 数据 通路 ， 就 显现 出 对 这 种 诬 套 的 模块 所 组 成 的 系统 的 特别 一 致 的 观点 。 在 最 低 

层 ， 诸 如 堆栈 和 寄存 器 单元 等 元 件 可 看 作 是 状态 机 ， 具 有 一 个 反馈 项 (输出 )、 两 个 

外 部 输入 (控制 信号 ) 以 及 一 个 1- 位 状态 寄存 器 。 这 些 基本 的 状态 机 以 结构 化 的 方式 

聚集 在 一 起 ， 在 层次 结构 的 上 一 层 形 成 一 个 状态 机 的 组 成 部 分 或 者 由 状态 机 控制 的 

数据 通路 。 

随后 ;， 他 们 继续 描述 了 设计 实际 集成 电路 的 方法 ， 该 方法 是 通过 建立 计算 机 辅助 设计 
(computer-aided design tool, CAD) 工具 来 实现 的 ， 该 工具 的 作用 就 像 一 个 宏 汇 编 器 对 于 软件 
的 作用 。 如 果 基 本 的 电路 单元 可 表示 成 一 些 标准 的 构件 块 或 单元 ， 则 与 宏 编译 器 的 类 比 ， 基 
种 符号 版 图 语言 就 能 从 这 些 标 准 单元 生成 IC 版 图 。 他 们 说 : 

用 户 定义 符号 ( 宏 ) 来 描述 基本 系统 单元 的 版 图 。 这 些 符 号 实例 的 位 置 和 方位 

是 用 语言 描述 的 ， 就 像 描 述 带 有 合适 参数 的 函数 一 样 。 这 些 符号 描述 接着 可 能 被 以 

某 种 方式 进行 机 械 化 处 理 ， 就 类 似 于 宏 汇 编 语言 程序 的 扩展 ， 所 产生 的 系统 及 图 的 

中 间 格 式 描述 就 类 似 于 用 来 产生 输出 文件 的 机 器 代码 。 

Mead 和 Conway 所 描述 的 是 你 应 该 很 熟悉 的 两 个 概念 。 一 个 概念 是 硬件 设计 结构 化 的 思 
想 。 你 可 能 将 这 称 为 “软件 工程 ”， 该 方法 开始 于 对 首先 是 需求 文档 然后 是 形式 化 规范 描述 的 
建立 。 从 那 开 始 ， 通 过 自 上 而 下 的 分 解 ， 定 义 各 种 功能 组 件 (模块 )， 在 开发 过 程 中 软件 设计 
不 断 进 展 。 

如 果 你 已 经 学 习 过 现代 编译 器 如 何 将 一 种 高 级 语言 转换 为 中 间 语 言 (汇编 语言 ) 再 转换 
为 机 器 代码 ， 则 第 二 个 概念 对 你 来 说 就 很 熟悉 。 这 里 ， 低 级 机 器 代码 用 标准 的 低级 单元 表示 ， 
这 些 单元 表示 晶体 管 级 电路 以 及 这 些 单元 间 的 互 连 。 

作者 正在 描述 的 就 是 我 们 现今 所 说 的 硅 编 译 器 (Silicon Compiler) ， 设 计 现 代 集 成 电路 的 
过 程 就 称 为 硅 编 译 (silicon compilation)。 硬 件 电路 设计 者 采用 的 是 高 级 开发 语言 ， 或 者 是 
Verilog 或 者 是 YHDL。VHDL 是 在 IEEE 标 准 1076-2001 一 一 IEEE 标 准 VHDL 参 考 手 册 s 中 正式 定 
义 的 。Verilog 被 看 作 是 “ 另 一 种 ”硬件 描述 语言 。Verilog 起 初 是 专 有 的 模拟 语言 ， 但 后 来 转 
给 IEEE 并 发 布 为 IEEE 标 准 1364-1995- 一 IEEE 基 于 Verilog 硬 件 描述 语言 的 标准 档 述 语言 ”。 

1981 年 ，Silicon Compliers 公 司 成 立 ， 其 目的 是 将 设计 描述 从 实现 中 脱离 出 来 *。 他 们 的 
主张 是 关心 设计 实现 ， 使 得 设计 者 的 关注 点 在 算法 上 。 为 了 做 到 这 一 点 ， 他 们 建造 能 转化 成 
定制 集成 电路 模块 的 库 和 代码 模块 ， 与 设计 专家 手工 设计 电路 的 方法 相同 。 
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1985 年 ，CMOS 工 艺 在 商业 上 已 经 可 以 应 用 ， 这 个 突破 驱动 了 ASIC 产 业 的 发 展 。 如 我 们 
所 见 ，CMOS 门 是 接近 于 理想 的 开关 ， 采 用 它 ， 就 实现 了 用 硅 编 译 技术 设计 集成 电路 的 商业 
可 行 性 。 在 CMOS 工 艺 出 现 之 前 ， 为 了 使 集成 电路 工作 正常 ， 还 需要 非常 多 的 手工 设计 工作 。 
根据 Cheng 的 描述 *:“ 功 耗 下 降 ， 品 声 裕 度 增加 ，1 就 是 1，0 就 是 0 ( 即 容易 区 分 )”。 

伴随 ASIC 设 计 在 商业 上 的 应 用 ， 出 现 了 硬件 描述 语言 (hardware description language， 
HDL) 工具 的 标准 化 ， 也 极 大 地 促进 了 采用 硅 编 译 设计 硬件 的 逻辑 综合 技术 的 发 展 。Silicon 


Compliers 公 司 与 Silicon Design Labs 在 1987 年 合并 成 立 了 Silicon Compiler Systems (SCS) 公 


司 。1990 年 ，SCS 被 在 电子 设计 自动 化 工具 方面 领先 的 供应 商 Mentor Graphics 公 司 所 收购 。 

你 可 以 在 图 5-27 中 看 到 硅 编 译 的 影响 。 

如 果 将 图 5-27 的 数据 画 在 半 对 数 图 纸 上 ， 你 将 会 得 到 一 个 令 人 惊奇 的 图 形 ， 它 非常 接近 直 
线 ， 从 而 显著 地 证 实 了 摩尔 定律 。 如 果 
考察 设计 一 个 集成 电路 所 需 的 设计 人 员 


Intel 微 处 理 器 


出 现时 间 
数 ， 比 如 具有 29 000 个 晶体 管 的 8086 对 4004 1971 
比 于 具有 42 000 000 个 晶体 管 的 奔腾 4 处 8005 1 
理 器 ， 我 们 一 定 会 得 出 这 样 的 结论 ， 就 8086 1978 
是 Intel 不 可 能 有 一 个 比 8086 设 计 队 伍 大 | 286 1982 
. 、 、、 、 386™ processor 1985 
约 大 2000 倍 的 奔腾 4 设计 队伍 。 我 们 必 486™ DX processor 1989 


然 得 出 的 结论 是 每 个 设计 者 将 晶体 管 。” | Pentium@ processor 1993 
(或 CMOS 门 ) 置信 硅 片上 的 效率 必然 是 。 | Poum Pes 997 
导致 这 种 增长 的 原因 ， 因 此 ， 就 像 C++ bt sso 2000 
将 程序 员 从 汇编 语言 编程 问题 中 解放 出 人 
来 一 样 ， 硅 编译 也 将 硬件 设计 者 从 集成 图 5-27 _ Intel 系列 微 处 理 器 中 晶体 管 数量 的 增长 。 由 
电路 设计 工艺 的 低级 问题 中 解放 出 来 。 Cheng 提供 

作为 熟悉 高 级 语言 的 人 ， 你 应 该 能 快速 适应 这 种 语言 的 结构 。 事 实 上 ， 相 对 来 说 ， 你 更 
像 是 在 写 软件 ， 而 不 是 在 设计 硬件 。 几 家 商业 软件 公司 已 达成 一 致 ， 而 且 目 前 已 有 将 分 开 的 
硬件 和 软件 的 设计 过 程 紧密 集成 为 高 层次 系统 设计 的 商业 工具 。 

然而 ， 软 件 和 硬件 开发 过 程 还 存在 一 个 差异 ， 就 是 修改 缺陷 的 成 本 。 作 为 软件 开发 者 ， 
你 知道 重新 编译 和 重新 建立 软件 映像 需要 几 天 的 时 间 。 这 个 过 程 涉及 很 好 地 确立 将 代码 的 
新 版 本 分 发 到 消费 者 的 方式 。 为 了 发 出 代码 更 新 信息 ， 你 可 能 要 向 一 个 FTP 地 址 邮寄 一 个 新 
版 本 。 

硬件 开发 者 就 没有 这 种 奢侈 。 即 使 设计 过 程 正在 接近 完成 ， 硬 件 设计 者 仍然 面临 着 这 样 
的 现实 ， 就 是 硬件 设计 是 一 个 复杂 的 、 昂 贵 的 和 耗 时 的 过 程 ， 很 少 或 没有 发 生 错 误 的 余地 。 
硬件 返工 的 成 本 可 轻易 地 耗 掉 500 000 美 元 ， 而 且 还 要 拖延 3 个 月 或 更 长 的 时 间 。 这 样 ， 即 使 
有 硅 编 译 技术 ， 硬 件 设计 工具 也 是 面向 测试 和 设计 模拟 而 高 度 结构 化 的 。 通 常 开发 一 个 新 的 
ASIC 所 需 时 间 要 在 实际 设计 时 间 和 用 模拟 对 硬件 进行 彻底 测试 所 需 时 间 之 间 进 行 平均 分 配 。 
当然 ， 硬 件 设计 者 总 是 有 一 个 B 计 划 备用 。 对 硬件 缺陷 的 普遍 解决 方案 在 现在 和 可 预见 的 未 来 
都 是 :“ 在 软件 中 改正 ”(fix it in software ) 。 

在 我 们 离开 这 个 话题 之 前 ， 实 际 地 看 一 些 VHDL 代 码 并 和 我 们 已 经 熟悉 的 语言 相 比较 是 有 
益处 的 。 下 面 是 一 个 加 法 电路 的 例子 (来自 Ashendento) . 我 们 首先 需要 声明 一 个 实体 (entity ) ， 
这 和 声明 一 个 变量 类 似 。 
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entity adder 这 
port (a: in word; 
b :in word ; 
sum : out word ) ; 
end entity adder ; 
其 次 ， 我 们 需要 描述 模块 的 内 部 操作 。 换 句 话说， 我 们 需要 编写 用 来 描述 变量 行为 的 语 
名 。 这 将 在 代码 的 结构 体 (architectural body) 中 实现 。 


architecture abstract of adder is 
begin 
add_a_b : process (ab )is 
begin 
sum <=a+b; 
end process add_a_b ， 


end architecture abstract; 


结构 体 命名 为 abstract， 它 包含 一 个 进程 atd_a_b， 用 来 描述 实体 的 操作 。 就 像 C++ 中 的 模 
板 函 数 一 样 ， 该 进程 假设 加 法 操作 符 “+ ”在 以 前 已 经 针对 数据 类 型 “word” 定 义 过 。 

我 们 可 以 容易 地 描绘 出 这 个 代码 片段 如 何 能 编译 成 一 个 由 1- 位 加 法 器 基本 元 件 组 成 的 电 
路 ， 如 图 5-24 所 示 的 那样 ， 但 不 同 的 是 ， 这 里 它 配置 成 了 加 16 位 或 更 大 的 变量 ， 称 为 “word”。 


总 结 
”第 5 章 开 始 于 对 算法 的 一 般 概 念 的 讨论 ， 即 一 个 算法 既 可 以 是 基于 一 序列 软件 步骤 的 解 ， 
也 可 以 是 基于 硬件 的 解 。 


* 我 们 考察 了 有 限 状态 机 的 定义 ， 并 了 解 了 如 何 将 状态 机 定义 成 Mealy 机 或 Moore 机 。 

“我 们 了 解 了 如 何 将 当前 状态 的 反馈 与 D 型 触发 器 相 结合 ， 使 我 们 能 够 同步 和 稳定 状态 迁移 。 
"我 们 考察 了 如 何 利用 我 们 建立 真 值 表 的 知识 来 构造 状态 机 的 硬件 实现 。 

“通过 构造 一 个 交通 十 字 路 口 榨 制 器 的 基于 存储 器 的 实现 ， 我 们 走 过 了 将 算法 建造 成 状 
态 机 的 过 程 。 

"最 后 ， 我 们 了 解 了 如 何 用 硬件 描述 语言 来 设计 硬件 系统 。 
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习题 
1. 下 图 是 一 个 由 三 个 DD 型 触发 器 和 一 些 逻 辑 门 组 成 的 状态 机 。 





假设 RESET 到 三 个 触发 器 的 输入 已 经 发 生 过 作用 了 。 完 成 下 面 所 示 的 状态 机 的 真 值 表 。 








Ain Bin Zz Aout Bout 
0 0 0 
1 0 0 
0 1 0 
1 1 0 
0 0 1 
1 0 1 
0 1 1 
1 1 


画 出 该 状态 机 的 完整 的 状态 迁移 图 。 为 简化 ， 不 必 考 虑 RESET 信 号 的 影响 。 提 示 : 从 
给 出 的 部 分 状态 迁移 图 开始 。 








0 


2. 下 图 所 示 的 是 某 个 任意 算法 的 状态 机 。 





假设 状态 机 已 接收 到 RESET 脉 冲 ， 并 处 于 状态 000 (S0 = 0, S1 = 0, S2 = 0) 。 完 成 状态 
120 迁移 图 的 绘制 。 
3. 下 图 显示 的 电路 包含 三 个 D 型 触发 器 。 黑 点 指示 的 是 相互 有 物理 连接 的 导线 。 RESET 输入 
端 始终 连接 到 逻辑 1， 故 永远 不 起 作用 。 在 接收 到 时 钟 脉冲 之 前 ， SET 输入 端 接收 到 一 个 
负 脉 冲 ， 确 立 了 电路 的 初始 条 件 。 画 出 该 电路 的 状态 迁移 图 。 





一 个 reset 脉 冲 过 后 ， 系 统 初 始 化 到 状态 000。 图 示 的 是 算法 的 实现 方法 。 电 路 的 输出 就 
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EN 


是 所 示 的 状态 变量 ABC。 这 些 变量 还 反馈 到 真 值 表 成 为 输入 变量 ， 在 下 一 时 钟 到 来 时 进行 


下 一 个 状态 迁移 。 画 出 对 应 于 这 个 硬件 算法 的 真 值 表 。 化 简 真 值 表 ， 然 后 画 出 用 等 价 的 门 
电路 代替 真 值 表 的 全 部 电路 。 提 示 : 记 住 ， 有 一 个 可 能 的 状态 在 算法 中 不 出 现 ， 你 可 以 将 
其 加 入 到 真 值 表 中 ， 这 可 能 有 助 于 你 得 到 更 简化 的 结果 。 

5. 假设 你 是 欢乐 时 光 防 风暴 外 门 和 售卖 机 公司 的 首席 设计 师 。 你 接 到 一 个 任务 ， 要 重新 设计 
公司 最 畅销 的 售卖 机 ， 这 是 一 个 简单 的 墙 模型 ， 安 装 在 自助 商店 的 休息 室 中 。 由 于 有 电源 
可 供 使 用 ， 你 决定 用 漂亮 的 新 式 电子 设备 取代 老式 的 机 械 模型 。 

你 决定 采用 状态 机 设计 形式 ， 状 态 机 如 下 图 所 示 。 





状态 机 可 在 4 个 状态 S0~S3 中 循环 。 另 外 ， 它 有 两 个 外 部 输入 4 和 b， 一 个 输出 z。 输 入 a 
表示 四 分 之 一 美元 放 入 硬币 槽 中 ,输入 b 表 示 一 角 (10 美 分 ) 硬币 放 和 人 硬币 槽 中 。 商 品 的 价 
格 是 30 美 分 ， 如 果 投 入 的 钱 超过 30 美 分 ， 也 不 找 零钱 。 输 出 z=1 就 引起 商品 的 交付 。 

4 个 状态 定义 如 下 : 

。S0 = 静止 状态 ， 没 有 钱 投入 

。S1 = 投入 10 美 分 

。S2 = 投入 20 美 分 

。S3 = 投入 25 美 分 

假设 顾客 投入 10 美 分 (ap=01) ， 这 将 导致 进入 状态 S1。 由 于 钱 数 不 够 ， 所 以 这 个 状态 
迁移 没有 导致 商品 交付 (z=0)。 这 时 就 有 两 种 可 能 : 如 果 又 投入 10 美 分 ， 就 进入 状态 S2， 
还 是 没有 商品 交付 ;但 如 果 又 投入 25 美 分 ， 则 交付 商品 并 返回 到 状态 SO0。 

如 果 先 投入 25 美 分 硬币 ， 则 进入 状态 S3， 但 没有 商品 交付 。 再 投入 硬币 就 导致 商品 交 
付 并 返回 到 状态 S0。 

不 可 能 同时 投 两 枚 硬币 ， 所 以 输入 ap=11 是 不 允许 的 。 此 外 ， 状 态 迁 移 标记 00/0 只 表示 
在 时 钟 脉冲 到 来 时 没有 发 生 任 何事 情 。 完 成 真 值 表 ， 用 KK 图 化 简 逻 辑 方程 ， 并 为 该 电路 画 
出 门 设计 。 

6. 设计 一 个 状态 机 电路 ， 用 于 检测 位 串 1001 的 出 现 。 你 的 答案 应 包括 状态 迁移 图 、 真 值 表 、 
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K- 图 ， 最 后 还 要 给 出 电路 实现 。 


.下 图 所 示 电 路 由 4 个 D 型 触发 器 和 两 个 异 或 门 组 成 。 注 意 设 有 采用 SET 输入 ， 只 有 RESET 可 


使 用 。 做 一 个 真 值 表 ， 显 示 : 

3. RESET 脉冲 后 ， 输出 Qo、 Qi Q: 和 Q: 的 状态 。 

b. 16 个 时 钟 脉冲 后 输出 的 状态 。 

c. 输出 再 回 到 相同 模式 ， 这 个 循环 需要 多 少时 钟 脉冲 ? 

d. 将 电路 重新 设计 成 有 限 状 态 机 。 为 简化 ， 使 每 个 模式 在 8 个 时 钟 脉冲 后 再 循环 。 为 每 个 状 
态 和 次 态 建立 真 值 表 ， 化 简 真 值 表 ， 画 出 门 电路 。 





第 6 章 总 线 组 织 和 存储 器 设计 


学 习 目 标 

。 理 解 总 线 组 织 的 必要 性 ， 

。 采 用 三 态 逻辑 原理 设计 面向 总 线 的 系统 ， 

。 为 现代 微 处 理 器 设计 存储 器 译 码 电 路 ， 

。 采 用 现代 存储 器 电路 的 地 址 、 数 据 及 控制 的 /O 引 脚 设计 任何 宽度 和 深度 的 存储 系统 。 


6.1 总 线 组 织 


在 第 2 章 中 ， 我 们 看 到 逻辑 门 的 输出 连接 到 其 他 有 逻辑 门 的 输入 ， 这 是 一 个 一 般 的 准则 。 输 
出 必须 连 到 输入 ， 你 可 以 同时 将 一 个 输出 连接 到 多 个 输入 ， 使 得 当 该 输出 改变 自身 状态 时 ， 
所 有 连接 到 它 的 输入 同时 看 到 这 个 变化 (当然 ， 这 仍然 在 光速 的 约束 范围 内 ) ， 这 称 为 1 到 N 
(one to N) 电路 配置 。 

然而 ， 你 不 能 将 多 个 输入 连 到 一 起 ， 除 非 它们 是 被 连接 到 一 个 输出 的 ， 这 是 因为 需要 有 
某 种 信号 来 将 这 些 输入 驱动 到 1 或 0。 若 没有 一 个 输出 来 驱动 ， 这 些 输入 将 趋 于 漂浮 不 定 ， 
频繁 地 在 1、0 之 间 变 化 ， 并 在 计算 机 中 产生 噪声 信号 。 一 般 来 说 ， 所 有 不 使 用 的 输入 都 
“捆绑 ”到 了 地 或 电源 电压 (V。。) 。 稍 后 你 将 会 看 到 ， 若 我 们 试图 将 两 个 或 更 多 的 输出 连 到 
起， 也 存在 类 似 的 问题 。 如 果 一 个 处 于 逻辑 1 状态 的 输出 连接 到 一 个 处 于 逻辑 0 状态 的 输 
出 ， 你 认为 会 发 生 什么 情况 呢 ? ” 忆 En SN 
我 们 会 最 终 得 到 平均 数 0.5 吗 ? | 
为 了 看 看 会 发 生 什么 ， 你 可 以 拿 
一 个 1.5V 的 电池 (如 AA 或 AAA 
电池 )， 用 一 段 导线 迅速 将 电池 F pp 
的 正 端 和 负 端 短路 。 如 果 接 触 良 A SR 4 [1 
好 ， 你 将 会 看 到 火花 ， 甚 至 一 股 
烟 。 一 般 来 说 ， 计 算 机 设计 者 不 
喜欢 看 到 哪怕 一 点 来 自 计 算 机 内 
部 的 烟 。 因 此 ， 和 希望 这 个 实验 使 
你 确信 ， 将 输出 连 在 一 起 不 是 一 
个 好 主意 。 

从 以 上 讨论 你 可 能 猜测 到 了 ， 
将 两 个 输出 连 在 一 起 类 似 于 电路 的 
短路 。 事 实 上 ， 我 们 可 能 损坏 了 电 
路 元 件 ， 因 为 每 个 元 件 都 在 试图 强 
迫 改 变 另 一 个 ,就 像 我 第 一 次 结婚 ，。” 图 61 基于 点 对 点 连 线 的 计算 机 组 织 。 该 图 显示 出 在 一 个 典型 的 计 
但 那 是 另外 一 个 故事 了 。 。 算 机 系统 中 ， 在 6 个 不 同 的 内 部 组 件 之 间 连 接 一 个 数据 位 所 

图 6-1 向 我 们 展示 了 计算 机 设 需 的 信号 线 数 ( 注 : 在 DVD 光盘 中 有 该 图 的 一 个 彩色 版 本 ) 
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计 的 基本 困境 ， 有 很 多 的 线 遍布 各 处 。 

图 6-1 是 要 显示 出 : 需要 这 些 如 “和 鼠 巢 ” 般 的 导线 才能 将 6 个 计算 机 电路 模块 互 连 。 在 这 
个 例子 中 ， 我 们 不 关心 这 些 功 能 模块 到 底 是 什么 ， 我 们 只 对 它们 如 何 连接 到 一 起 感 兴 趣 。 而 
且 ， 互 连 只 显示 出 一 个 数据 位 。 对 于 一 个 真正 的 计算 机 系统 ， 我 们 需要 将 这 些 迷 宫 般 的 线 乘 
以 32， 而 且 ， 现 代 计 算 机 有 远 多 于 6 个 的 功能 模块 需要 互 连 。 

每 个 功能 模块 将 其 输出 信号 连接 到 其 他 5 个 模块 的 输入 ， 线 上 的 箭头 指示 的 是 哪个 模块 在 
发 送信 号 。 在 每 个 功能 模块 内 部 ， 必 然 有 某 种 输入 /输出 (1/0) 接 口 和 控制 电路 ， 使 得 计算 机 能 
够 对 发 送 模块 和 接收 模块 进行 同步 。 因 为 通常 在 任意 时 间 点 只 有 一 个 模块 发 送 ， 也 只 有 一 个 
模块 接收 。 因 此 ， 所 有 模块 都 在 输出 1 和 0， 但 是 在 一 个 时 间 点 ， 某 模块 应 该 只 接收 一 个 模块 
的 输出 ， 这 意味 着 IO 接口 电路 必须 用 某 种 方式 来 决定 接收 哪个 功能 模块 的 输出 ， 忽 略 哪 些 模 
块 的 输出 。 

图 6-2 显 示 出 更 详细 一 些 的 1/0 组 织 。 每 个 模块 的 输出 以 “1 到 5” 结 构 同 时 驱动 其 他 模 
块 的 输入 。 在 输入 这 一 侧 ， 每 个 模块 必须 有 用 来 决定 在 每 个 时 间 点 接收 哪个 输出 的 逻辑 ， 
这 样 就 需要 决策 逻辑 ， 称 为 多 路 选择 器 (multiplexer, MUX)， 用 来 做 “5 到 1” 的 选择 ， 
使 得 正确 的 数据 被 读 到 输入 端 ， 并 传递 到 复杂 功能 模块 中 。 这 很 复杂 ， 如 果 拿 不 出 比较 好 
的 解决 方案 ， 我 们 就 会 被 淹没 在 这 些 线 中 。 如 果 我 们 能 有 像 图 6- -3 那样 连接 的 电路 就 比较 理 
想 了 。 






复杂 功能 模块 #1 





输出 决策 逻 划 


从 #2 | 从 #3 | 从 4 | AS | 从 46 | 输出 | 输出 下 Pe 输出 
输入 输入 输入 输入 输入 到 #2 到 #3 到 #4 到 #5 到 #6 





来 自 其 他 模块 的 单个 位 输入 到 其 他 模块 的 单个 位 输出 


图 6-2 单个 位 通信 协议 所 需 电 路 的 详细 模块 视图 ， 用 来 实现 6 个 功能 模块 之 间 的 点 对 点 连 线 


在 图 6-3 中 ， 我 们 试图 大 幅度 地 简化 设计 。 每 个 功能 模块 只 引出 一 条 线 ， 它 既 承担 数据 输 
入 的 任务 ， 也 承担 数据 输出 的 任务 。 记 住 ， 这 仍然 只 是 一 位 数据 。 这 也 许 简单 化 了 ， 但 你 车 
说 它 因为 将 输出 和 输入 捆绑 到 一 起 而 不 能 工作 ， 那 么 你 是 正确 的 ， 这 正 是 我 们 早先 考虑 过 的 
问题 。 我 们 正 试图 从 模块 #1 向 模块 #6 发 送 一 个 1 ( 灰 虚 线 箭头 )。 所 有 其 他 输出 是 0 ( 黑 虚 线 
箭头 )， 所 以 数据 不 能 发 送 。 我 们 需要 以 某 种 方式 管理 通过 电路 的 交通 流 (注意 到 巧妙 的 夹 钳 
技术 )。 我 们 解决 这 个 问题 的 方式 就 是 将 数据 通路 组 织 成 总 线 (bus ) ， 然后 利用 我 们 在 第 2 章 
学 习 到 的 第 4 个 基本 门 结构 ， 即 三 态 缓冲 器 。 
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图 6-3 采用 总 线 协 议 来 互 连 功能 模块 。 由 于 输入 和 输出 连 在 一 起 ， 就 产生 了 问题 


总 线 是 作为 简化 计算 机 系统 内 部 的 组 织 和 数据 流 的 一 种 方式 而 发 明 出 来 的 ， 我 们 使 用 总 
线 就 能 使 很 多 设备 同时 连 到 同一 个 数据 通路 上 。 一 个 总 线 就 是 一 组 类 似 的 信号 。 我 们 马上 就 
会 看 到 总 线 的 更 多 细节 ， 但 现在 让 我 们 首先 解决 如 何 将 这 些 恼人 的 信号 连 在 一 起 ， 而 又 不 至 
于 烧 坏 这 个 问题 。 

在 大 多 数 计算 机 中 有 三 条 主要 的 总 线 ， 称 为 地 址 总 线 (address bus) 、 数 据 总 线 (data bus ) 
及 状态 总 线 (status bus)。 我 们 将 在 下 一 章 更 详细 地 讨论 这 些 总 线 ， 但 现在 让 我 们 再 一 次 考虑 
输出 问题 。 图 6-4 显 示 出 了 这 种 困境 ， 左 边 与 门 的 两 个 输入 都 是 1， 所 以 其 输出 是 1， 即 5V。 


0 (0 
,| A ee Gre 
和 (总 线 竞争 ) 
实际 结果 将 是 一 个 不 确定 的 逻辑 电 平 | 


图 6-4 试图 将 两 个 逻辑 门 的 输出 捆绑 到 同一 个 数据 总 线 会 产生 的 问题 。 
我 们 将 在 总 线 上 看 到 什么 样 的 逻辑 电 平 


右边 逻辑 门 的 两 个 输入 中 一 个 是 1 一 个 是 0， 所 以 其 输出 是 0 ( 即 0V)， 总 线 上 的 结果 信号 
就 是 不 确定 的 。 为 解决 这 个 问题 ， 我 们 需要 采取 某 种 方法 将 逻辑 函数 从 接口 中 分 离 出 来 ， 并 
加 入 到 总 线 中 去 。 要 做 到 这 一 点 ， 可 通过 将 连接 到 总 线 的 逻辑 设备 电路 划分 成 两 部 分 : 逻辑 
函数 和 总 线 接口 单元 。 在 图 6-1 和 图 6-2 中 我 们 看 到 了 接口 电路 的 必要 ， 然 而 ， 在 本 例 中 总 线 接 
” 口 单 元 不 是 一 个 多 路 选择 器 (用 来 对 来 到 设备 的 各 种 输入 信号 进行 选择 )。 接 口 逻 辑 要 比 这 简 
单 得 多 ， 它 是 一 个 简单 的 开关 ， 用 来 将 输出 和 总 线 连 接 或 断 开 。 

图 6-5 给 出 了 图 示 。 到 总 线 的 接口 是 一 个 电子 开关 。 正 如 你 已 知道 的 ， 该 电子 开关 是 一 个 
三 态 缓冲 器 。 总 线 控制 信号 可 快速 激活 开关 ， 使 得 输出 连接 到 总 线 或 从 总 线 上 断 开 。 如 果 除 
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了 一 个 输出 以 外 ， 其 他 各 个 模块 的 输出 都 断 开 ， 则 这 个 连接 到 总 线 的 输出 就 会 “驱动 总 线 ” 
达到 高 逻辑 电 平 或 低 有 逻辑 电 平 。 由 于 这 个 输出 是 唯一 的 “讲话 者 "， 所 有 其 他 的 器 件 都 是 “了 听 
者 ”( 从 1 到 N)， 所 以 没有 任何 来 自 其 他 输出 器 件 的 冲突 。 所 有 其 他 输出 通过 其 电子 开关 与 总 
线 保持 断 开 状态 ， 对 总 线 信 号 的 状态 没有 影响 。 





总 线 控制 本 总 线 
。 关 闭 开关 > 输出 连接 
。 打 开 开 关 > 输 出 断 开 


图 6-5 总 线 接口 逻辑 的 机 械 图 表示 


如 你 所 知 ， 用 三 态 缓冲 器 并 不 是 真 要 打破 门 到 总 线 的 电 连 续 性 ， 我 们 只 是 简单 地 对 电路 
的 一 小 部 分 的 导电 性 做 了 一 个 快速 的 改变 ， 而 该 部 分 电路 居于 门 的 逻辑 输出 和 总 线 信号 之 间 。 
在 图 6-5 中 ， 我 们 将 电路 的 连接 / 断 开 部 分 画 成 像 是 房间 墙 上 的 灯 开 关 ， 以 此 来 简化 这 个 电路 魔 
术 。 但 请 记 住 ， 我 们 可 不 能 像 从 高 阻抗 (无 信号 流 ) 到 低 阻 抗 (连接 到 总 线 ) 那样 快速 而 干 
净利 落地 打开 和 关闭 一 个 机 械 开关 。 

通常 总 线 控制 信号 是 低 有 效 的 。 不 管 是 什么 逻辑 状态 (1 或 0) 要 放 到 总 线 上 ， 我 们 都 必 
须 首 先 将 那个 门 、 功 能 模块 、 存 储 单元 等 的 总 线 控制 置 为 低 ， 以 此 将 门 连接 到 总 线 上 ， 这 样 
逻辑 器 件 的 输出 就 可 连接 到 总 线 。 这 个 信号 有 若干 个 名 字 ， 有 时 它 叫 输出 使 能 (output 
enable，O 巨 ) ， 也 叫 芒 片 使 能 (chip enable，CE ) 或 者 芯片 选择 (chip select，CS ) 。 这 些 信和 号 
并 不 都 是 一 样 的 ， 我 们 很 快 就 会 看 到 ， 它 们 将 在 器 件 内 部 执行 不 同 的 任务 ， 但 它们 都 有 一 个 
共同 的 特性 ， 就 是 将 器 件 从 总 线 上 断 开 使 其 不 能 输出 。 

回 过 头 来 看 图 2-6 的 三 态 逻辑 门 ， 我 们 看 到 当 O5E 即 总 线 控制 信号 为 低 时 ， 电 路 总 线 接口 
(BUS IF) 部 分 的 输出 就 遵循 输入 的 值 。 当 C5 信号 为 高 时 ，BUS LF 的 输出 就 变 为 高 阻抗 ， 
有 效 地 将 该 门 从 电路 中 断 开 。 还 有 最 后 一 点 需要 强调 ， 电 路 的 三 态 门 不 改变 门 、 存 储 器 器 件 
或 其 他 任何 与 它 连 接 的 器 件 的 逻辑 状态 。 它 的 唯一 功能 就 是 将 门 的 输出 与 总 线 隔离 开 来 ， 使 
得 另 一 个 器 件 可 以 控制 总 线 和 发 送信 号。 

现在 让 我 们 看 看 如 何 使 单个 位 的 总 线 成 为 真正 数据 总 线 的 一 部 分 。 参 见 图 6-6， 在 这 里 我 
们 看 到 总 线 实际 上 是 由 8 条 类 似 信号 所 构成 的 组 。 在 该 例 中 ， 它 代表 8 个 数据 位 。 如 果 我 们 拆 
开 录 像 机 并 观察 里 面 的 微 处 理 器 ， 我 们 可 能 会 在 里 面 发 现 一 个 8 位 的 微 处 理 器 。 数 据 总 线 的 位 
数 指 的 是 我 们 在 一 个 操作 中 能 取出 的 数 的 大 小 。 回 忆 可 知 ，8 位 能 使 我 们 表示 从 0 到 255 ( 即 28) 
之 间 的 数 。 

总 线 仍 由 8 个 单独 信号 线 组 成 ， 这 8 个 信号 线 是 互相 电 隔 离 的 。 记 住 这 一 点 很 重要 ， 原 因 是 
为 了 使 我 们 的 制图 简化 ， 我 们 通常 都 将 总 线 画 成 一 条 线 ， 而 不 是 画 成 8 条 、16 条 或 32 条 线 。 总 线 
的 每 条 线 用 相应 的 数据 位 标记 ， 从 DB0 到 DB7， 其 中 DB0 表 示 数 字 2" 或 1，DB7 表 示 数 字 27 或 128。 

虚线 内 就 是 连接 到 总 线 的 器 件 ， 器 件 内 的 每 个 数据 位 都 通过 三 态 缓冲 器 与 总 线 上 的 相应 
数据 线 相连 。 注 意 CE 信号 是 如 何 同时 连接 到 所 有 的 三 态 缓冲 器 的 : 通过 将 CE 置 为 低 ， 就 将 
所 有 8 个 单独 的 数据 位 与 数据 总 线 连 接 起 来 了 。 还 要 注意 这 8 个 三 态 缓冲 器 ( 画 成 三 角形 ， 旁 
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边 有 图) 决 不 会 改变 数据 值 ， 它 们 只 是 将 功能 模块 内 部 的 8 个 数据 位 (DB0...DB7) 上 的 信号 
连接 到 功能 模块 外 相应 的 数据 线 上 。 不 要 混淆 三 态 缓冲 器 和 非 门 ， 非 门 是 将 输入 信号 取 反 ， 
而 三 态 缓冲 器 则 是 控制 是 否 允 许 信号 通过 缓冲 器 传播 。 





图 6-6 8 位 宽 数据 总 线 的 三 态 总 线 组 织 


图 6-7 更 进一步 地 引申 了 这 个 概念 ， 这 里 我 们 有 4 个 32 位 存储 寄存 器 连接 到 32 位 数据 总 线 。 

注意 这 里 是 画 出 数据 位 D0...D31 来 显示 这 些 单独 的 位 是 怎样 变 成 32 位 总 线 的 。 图 6-7 还 显示 了 
一 个 新 的 逻辑 元 件 ， 就 是 标记 为 “2:4 地 址 译 码 器 ”的 模块 。 回 忆 可 知 ， 我 们 需要 用 某 种 方式 
来 决定 哪 一 个 器 件 可 将 其 数据 放 到 总 线 上 ， 因 为 每 次 只 能 有 一 个 输出 。 译 码 器 电路 做 的 正 是 
这 件 事情 。 设 想 一 下 ， 有 两 个 来 自 电 路 中 某 个 其 他 部 件 的 信号 A0O 和 A1， 用 来 确定 在 给 定 的 时 
间 图 中 显示 的 4 个 32 位 寄存 器 中 的 哪个 连接 到 总 线 。 这 两 个 标记 为 A0 和 Al 的 “地 址 ”输入 位 
给 了 我 们 4 种 可 能 的 组 合 ， 这 样 ， 我 们 就 能 生成 某 种 相对 简单 的 逻辑 门 电路 ， 用 来 将 输入 A0 和 
A1 的 组 合 转化 为 4 个 可 能 的 输出 ， 这 就 是 芯片 选择 位 CS0 、 CSI 、C52 及 C53 。 这 个 电路 设 
计 与 你 已 经 习惯 的 电路 设计 有 点 不 同 ， 因 为 我 们 想 让 “ 真 ”的 输出 变 低 ， 而 不 是 变 高 。 这 个 
结果 是 由 三 态 门 逻辑 通常 是 低 输入 信号 有 效 这 个 事实 所 造成 的 。 
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图 6-7 4 个 32 位 存储 寄存 器 连接 到 总 线 。2 : 4 译 码 器 接收 2 个 输入 变量 A0 和 Al， 
并 从 4 个 输出 C50 … C53 中 只 选择 一 个 使 之 有 效 


表 6-1 就 是 图 6-7 中 2 : 4 译 码 器 电路 的 真 值 表 。 


表 6-1 2 : 4 译 码 器 电路 的 真 值 表 


如 同 我 们 以 前 所 讨论 过 的 ， 在 三 态 门 的 输入 端 画 圈 是 常见 的 ， 这 意味 着 该 信号 是 低 电 了 
有 效 的 。 正 像 NAND 门 和 NOR 门 中 反 相 门 输出 处 的 圈 指 出 信号 反 相 一 样 ， 门 输入 处 的 圈 指 出 
它 是 低 电压 有 效 (TURE) 。 这 就 又 回 到 了 我 们 以 前 的 讨论 ， 就 是 关于 1 和 0 哪个 代表 TRUE， 
哪个 代表 FALSE 是 相当 随意 的 。 

在 继续 考察 存储 器 组 织 之 前 ， 让 我 们 重 温 一 下 前 面 章节 中 讲 到 的 算法 自动 机 。 通 过 本 市 
对 总 线 概念 的 介绍 ， 我 们 对 理解 基于 总 线 的 系统 操作 如 何 由 状态 机 来 控制 就 有 了 更 好 的 基础 。 
图 6-8 为 我 们 展示 了 计算 机 控制 系统 一 部 分 的 一 个 简化 的 示意 图 ， 所 示 的 每 个 寄存 器 ( 即 寄存 
器 A、 寄 存 器 B、 临 时 寄存 器 以 及 输出 寄存 器 ) 都 有 单独 的 控制 ， 用 来 在 时 钟 输入 的 上 升 沿 将 
数据 读 入 到 寄存 器 ， 还 有 一 个 输出 使 能 ( OE ) 信号 使 寄存 器 能 将 数据 放 到 公共 数据 总 线 上 ， 
该 总 线 连接 了 计算 机 内 部 的 所 有 功能 元 件 。 


clk_A oe_A clk_B oe_B 


微 时 序 控制 器 





图 6-8 计算 机 控制 系统 的 一 部 分 示意 图 。 寄 存 器 采用 三 态 门 和 总 线 互 连 。 微 时 序 控制 器 
必须 为 每 个 寄存 器 的 输出 使 能 ( OE ) 正确 地 定 序 ， 使 得 不 存在 总 线 竞争 


为 了 将 数据 放 入 寄存 器 A， 我 们 首先 必须 使 另 一 个 数据 源 有 效 (也 许 就 是 存储 器 )， 并 将 
数据 放 到 数据 总 线 上 。 当 数据 稳定 后 ， 时 钟 信号 clk_A 经 过 一 个 从 低 到 高 的 转换 并 将 数据 存 到 
寄存 器 。 记 住 寄存 器 A 只 是 一 组 具有 共同 时 钟 的 D 触 发 器 。 现 在 假设 我 们 想 将 寄存 器 A 和 寄存 
器 B 的 内 容 加 起 来 。 算 术 和 逻辑 单元 (ALU) 需要 两 个 输入 源 来 进行 数字 相 加 。 因 为 ALU 本 
身 是 一 个 异步 门 设 计 ， 所 以 它 要 有 一 个 临时 寄存 器 和 一 个 输出 寄存 器 。 也 就 是 说 ， 因 为 没有 D 
寄存 器 在 那里 同步 其 行为 ， 所 以 如 果 输 入 改变 ， 输 出 也 将 立即 改变 。 

图 6-9 显 示 出 用 于 控制 微 时 序 控制 器 行为 的 一 部 分 真 值 表 。 为 了 将 两 个 数 相 加 ， 比 如 将 A 
和 B 的 内 容 相 加 ， 我 们 可 能 要 发 出 汇编 语言 指令 : 
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图 6-9 图 6-8 的 微 时 序 控制 器 的 真 值 表 ， 显 示 出 每 个 时 钟 脉冲 前 后 的 逻辑 电 平 变化 。 表 的 左 侧 显 示 
的 是 时 钟 脉冲 之 前 输出 的 状态 ， 而 右 侧 显示 的 是 时 钟 脉冲 之 后 输出 的 状态 。 灰 色 区 域 是 为 了 
突出 显示 每 个 时 钟 脉冲 发 生 时 的 变化 


这 个 指令 告诉 计算 机 将 寄存 器 A 和 寄存 器 B 的 内 容 相 加 ， 并 将 结果 放 回 到 寄存 器 A 中 。 如 
果 该 加 法 操作 产生 了 进位 , 则 将 其 放 到 进位 位 的 位 置 , 就 显示 在 配属 于 ALU 输 出 寄存 器 的 “C” 


位 上 。 这 样 ， 我 们 就 明白 了 需要 若干 步骤 将 这 些 数 相 加 。 我 们 用 文字 来 描述 这 个 过 程 : 
1. 将 数据 从 存储 器 拷贝 到 寄存 器 A 中 。 这 个 数据 将 是 操作 数 #2。 
2. 将 操作 数 #1 从 存储 器 拷贝 到 寄存 器 B 中 。 
3. 将 数据 从 寄存 器 A 移动 到 临时 寄存 器 中 。 
4. 将 ALU 中 的 加 法 结果 移动 到 ALU 的 输出 寄存 器 和 进位 位 。 
5. 将 数据 从 输出 寄存 器 移 回 到 寄存 器 A。 
参见 图 6-9 的 真 值 表 ， 我 们 在 控制 器 中 可 遵循 下 面 的 指令 流 : 


时 钟 脉冲 1: 
时 钟 脉冲 2， 
时 钟 脉冲 3: 


时 钟 脉冲 4: 


时 钟 脉冲 5， 
时 钟 脉冲 6: 


时 钟 脉冲 7: 
时 钟 脉冲 8: 


寄存 器 A 的 输入 时 钟 有 一 个 从 低 到 高 的 转换 ， 将 目前 数据 总 线 持 有 的 数据 存 到 寄存 器 A 中 

寄存 器 B 的 输入 时 钟 有 一 个 从 低 到 高 的 转换 ， 将 目前 数据 总 线 持 有 的 数据 存 到 寄存 器 B 中 

输入 到 B 时 钟 返回 到 0， 寄 存 器 A 的 输出 使 能 信号 变 成 有 效 。 这 就 将 原来 存储 于 寄存 器 A 
的 数据 放 回 到 数据 总 线 。 时 钟 信号 变 低 对 寄存 器 B 没 有 影响 ， 因 为 这 是 一 个 下 降 沿 

临时 寄存 器 的 输入 时 钟 有 一 个 上 升 沿 ， 该 动作 存储 了 原先 在 寄存 器 A 中 而 现在 在 数据 总 
线 上 的 数据 。 寄 存 器 A 的 输出 使 能 信号 关闭 ， 而 寄存 器 B 的 输出 使 能 信号 打开 。 这 时 ， 存 储 
于 寄存 器 B 中 的 数据 就 在 总 线 上 ， 而 存储 于 寄存 器 A 中 的 数据 就 存 于 临时 寄存 器 中 。ALU 的 
输入 信号 ALU_0、ALU_1 及 ALU_2 被 置 位 用 于 相 加 *， 所 以 ALU 的 输出 就 是 A 与 B 的 和 以 及 
产生 的 进位 

在 clk_out 信 号 的 上 升 沿 ， 该 和 被 存 入 输出 寄存 器 

寄存 器 B 的 输出 使 能 被 关闭 ，B 的 时 钟 输入 返回 到 0， 临 时 寄存 器 中 的 数据 被 放 到 数据 总 
线 上 

数据 通过 时 钟 被 存 人 寄存 器 A， 临 时 寄存 器 的 输出 使 能 被 关闭 

系统 返回 到 初 态 


注 : *ALU 是 一 个 电路 ， 能 根据 三 个 输入 变量 ALU_0...ALU_2 的 状态 执行 最 多 8 个 不 同 的 算术 和 还 辑 操 作 。 
在 这 个 例子 中 ， 我 们 假设 ALU 的 代码 为 000 就 表示 ALU 准 备 好 对 两 个 输入 变量 执行 加 法 操作 
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现在 ， 在 结束 这 个 话题 之 前 ， 假 如 你 是 一 个 合格 的 CPU 设计 师 ， 我 要 提醒 一 下 ， 你 还 要 
涉及 比 这 个 例子 更 多 的 东西 ， 但 是 ， 原 理 是 一 样 的 。 对 于 初学 者 ， 我 们 不 讨论 指令 ADD B， 
A 本 身 如 何 实际 地 进入 计算 机 ， 以 及 计算 机 如 何 断 定 该 指令 的 功能 。 我 们 也 不 讨论 在 这 之 前 如 
何 确立 A 和 B 寄 存 器 的 内 容 。 然 而 ， 至 少 对 于 状态 机 中 实际 做 加 法 过 程 的 那 一 部 分 ， 它 可 能 是 
非常 接近 于 电路 真实 工作 情况 的 。 

关于 如 何 用 状态 机 对 一 系列 逻辑 操作 定 序 ， 以 及 在 计算 机 中 这 些 操 作 如 何 构成 指令 执行 
的 基础 ， 你 现在 已 经 看 到 了 两 个 例子 。 没 有 基于 总 线 体系 结构 和 三 态 逮 辑 门 设计 的 概念 ， 要 
完成 这 些 事情 是 很 困难 的 ， 也 是 不 可 能 的 。 


存储 系统 设计 


我 们 已 经 知道 了 触发 器 的 概念 ， 尤 其 是 ， 我 们 看 到 了 如 何 用 D 触 发 器 存储 单个 位 的 信息 。 
我 们 记得 ， 在 时 钟 信号 的 上 升 沼 ，D 触 发 器 输入 端的 数据 就 将 被 存 到 器 件 中 ， 存 储 的 值 就 将 被 
传输 到 Q 输 出 。 即 便 时 钟 信号 已 经 过 去 ，Q 输 出 端 也 仍 会 呈现 这 个 数据 。 换 旬 话 说， 我 们 刚 存 
了 1 位 数据 ，D 触 发 器 电路 就 是 一 个 存储 单元 。 

历史 上 曾经 存在 很 多 不 同 的 器 件 作 为 计算 机 的 随机 存储 器 (random access memory， 
RAM) 来 存储 信息 ， 如 集成 电路 (IC) 得 到 广泛 应 用 之 前 ， 磁 芯 存 储 器 (core memory) 这 
样 的 磁器 件 曾 是 非常 重要 的 。 今 天 ， 一 个 IC 存储 器 件 能 存 S12MB 的 数据 位 ， 随 着 这 种 器 件 的 
小 型 化 ， 磁 器 件 已 经 无 靶 在 速度 和 容量 上 赶 上 半导体 存储 器 了 。 然 而 ， 基 于 磁 存 储 的 存储 器 
与 IC 存 储 器 相 比 一 直 有 一 个 优势 ， 那 就 是 它们 在 电源 关 掉 后 不 会 丢掉 数据 ， 所 以 ， 我 们 仍然 
还 用 硬盘 驱动 器 和 磁带 存储 器 作为 第 二 级 存储 系统 ， 因 为 即使 去 掉 电 源 它们 也 能 保持 数据 。 

很 多 产业 分 析 家 都 在 预测 硬盘 驱动 器 的 终结 。 在 你 的 PDA、 数 字 相 机 、 或 MP3 播 放 器 中 
会 用 到 的 现代 FLASH 存 储 器 已 经 达到 1GB 存 储 容量 。FLASH 存 储 器 在 去 掉 电 源 后 也 能 保持 信 
息 ， 而且 比 硬盘 驱动 器 更 快 、 更 强健 。 但 是 ,硬盘 驱 动 器 和 磁带 驱动 器 在 容量 和 单个 位 的 价 
格 方面 更 胜 一 筹 。 在 写 这 本 书 的 时 候 (2004 年 夏 )， 如 果 你 愿意 递送 所 有 的 回扣 信息 而 公司 也 
实际 地 向 你 返回 了 回扣 单 ， 那 么 一 个 容量 为 160GB 的 现代 硬盘 驱动 器 用 大 约 90 美 元 就 可 买 到 ， 
但 那 是 在 另外 一 个 时 间 的 另外 一 回 事情 了 。 

硬盘 和 磁带 系统 是 机 电 系统 (electromechanical system) ， 带 有 电机 和 运动 部 件 。 机 械 组 
件 导致 它们 远 没 有 IC 存储 器 可 靠 ， 也 慢 得 多 ， 一 般 要 比 IC 存储 器 慢 10 000 倍 。 正 是 这 个 原因 ， 
我 们 不 采用 硬盘 作为 我 们 计算 机 系统 的 主 存储 器 ， 它 们 太 慢 了 。 然 而 ， 你 将 在 后 面 的 课程 中 
看 到 ， 硬 盘 可 提供 几乎 无 限 的 存储 能 力 ， 使 得 像 Linux 和 Windows 这 样 的 操作 系统 能 给 用 户 这 
样 的 印象 ， 即 每 个 台式 机 上 打开 的 应 用 总 是 具有 其 所 需要 的 那么 多 存储 量 。 

在 本 部 分 中 ， 我 们 将 从 D 触 发 器 作为 一 个 单独 器 件 开 始 ， 看 一 看 如 何 将 很 多 这 样 的 器 件 互 
连 起 来 构成 存储 器 阵列 。 为 了 看 看 数据 如 何 沿 着 同一 信号 路 径 写 入 和 读 出 存储 器 (虽然 不 是 
在 同一 时 刻 ) ， 请 看 图 6-10。 

图 中 的 黑箱 只 是 基本 D 触 发 器 的 一 个 稍微 简化 的 形式 、 我 们 去 掉 了 5、 五 输入 和 2 输出 。 
深 灰 箱 是 三 态 缓冲 器 ， 它 由 单独 的 OE (输出 使 能 ) 输入 所 控制 。 当 OF 为 高 时 ， 三 态 缓冲 器 
无 作用 ， 存 储 器 单元 的 Q 输 出 与 数据 线 (数据 输入 /输出 线 ) 隔离 (高 阻抗 状态 ) 。 然 而 ， 数 据 
线 与 单元 的 D 输 入 还 是 连 着 的 ， 所 以 可 以 将 数据 写 和 人 单元， 但 是 ， 在 三 态 缓冲 器 起 作用 之 前 ， 
写 到 单元 的 新 数据 对 于 要 从 单元 读数 据 的 人 来 说 不 是 立即 可 见 的 。 当 我 们 将 基本 触发 器 单元 
和 三 态 缓冲 器 结合 起 来 时 ， 我 们 就 有 了 制造 1 位 存储 单元 所 需要 的 一 切 东 西 。 这 一 点 由 图 中 包 
侍 的 刚才 所 讨论 的 两 个 元 件 的 线 灰 箱 所 标明 。 
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写 信 号 有 点 容易 被 误解 ， 所 以 我 们 要 讨论 一 下 。 我 们 知道 数据 是 在 一 个 脉冲 的 上 升 沿 被 
写 入 到 D 触 发 器 的 ， 这 在 图 6-10 中 用 写 脉冲 ( 丈 ) 上 的 向 上 箭头 指出 了 。 为 什么 写 信号 W 
被 写成 好 像 是 低 有 效 的 信号 呢 ? 原因 是 我 们 通常 将 写 信号 保持 在 1 状态 。 为 了 完成 一 个 写 操 
作 ， 胡 必须 变 低 ， 然 后 再 回 到 高 。 正 是 这 个 低 到 高 的 转换 完成 了 实际 的 数据 写 操作 ， 但 由 
于 我 们 必须 将 写 线 变 低 才能 完成 对 数据 的 实际 写 操作 ， 我 们 就 认为 写 信号 是 低 有 效 的 。 而 且 ， 
尔 应 该 从 这 个 讨论 中 推断 出 ， 你 永远 不 能 让 丈 线 和 OE 线 同时 有 效 ， 你 或 者 让 W 变 低 而 OE 
保持 为 高 ， 或 者 反之 ， 它 们 永远 不 能 同时 为 低 。 现 在 ， 让 我 们 回 到 对 存储 器 阵列 的 分 析 。 


单个 位 的 存储 单元 
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图 6-10 一 个 单个 位 存储 器 的 示意 图 表示 。 单元 输出 上 的 三 态 缓冲 器 控制 什么 时 候 Q 输 出 可 连接 到 总 线 
在 解决 复杂 性 方面 ， 我 们 将 采取 另 一 个 途径 ， 就 是 由 三 态 门 器 件 和 D 触 发 器 来 建造 存储 器 。 
图 6-11 显 示 出 一 个 简单 (也 许 并 不 那么 简单 ) 的 16 位 存储 器 ， 组 织 成 4 个 4 位 半 字 节 。 每 个 存储 位 
是 一 个 微型 的 D 触 发 器 ， 它 在 内 部 也 有 一 个 三 态 缓冲 电路 ， 所 以 我 们 可 用 它 建造 一 个 总 线 系 统 。 





图 6-11 用 分 立 的 D 触 发 器 建造 的 16 位 存储 器 。 在 这 4 个 行 中 ， 如 果 将 
地 址 位 AO 和 A1l 置 为 0%， 我 们 将 访问 最 上 面 一 行 。 类 似 地 ， 
(A0, A1)= (1,0)、(0,1) 或 (1,1) 将 分 别 访问 第 1、2、3 行 
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一 行 的 4 个 D 触 发 器 有 两 个 共同 的 控制 线 ， 用 来 提供 时 钟 功能 ( 写 )， 并 为 将 数据 放 到 
IO 总 线 提 供 使 能 功能 。 注 意 每 一 行 相 应 位 的 位 置 是 如 何 连接 到 同一 条 线 的 ， 这 就 是 为 什么 我 
们 需要 在 每 个 位 单元 (D 触 发 器 ) 上 都 需要 三 态 控制 信号 OE 。 例 如 ， 如 果 我 们 想 将 数据 写 人 
第 2 行 的 DD 触发 器 ， 则 必须 将 数据 从 外 部 器 件 放 入 到 DB0 到 DB3， 而 且 W2 信 号 必须 变 高 以 存储 
数据 。 此 外 ， 要 将 数据 写 进 单 元 ，OE 信 号 必须 保持 高 状态 ， 以 防止 已 经 存储 在 单元 中 的 数据 
被 放置 到 数据 线 上 并 毁 掉 正 在 写 人 到 单元 的 新 数据 。 “ 

到 16 位 存储 器 的 控制 输入 显示 在 图 6-11 的 左边 ， 数 据 输 入 和 输出 〈 即 IO) 显示 在 器 件 的 
项 部。 注意 每 个 数据 位 只 有 一 条 IHO 线 ， 这 是 因为 数据 可 在 同一 条 线 上 流入 和 流出 。 换 名 话说， 
我 们 已 经 使 用 了 总 线 组 织 来 简化 数据 流入 器 件 和 数据 流出 器 件 。 让 我 们 对 每 个 控制 输入 做 一 
下 定义 : 


A0 和 Al 地 址 输入 , 用 于 选择 存储 器 的 哪 一 行 正在 被 寻 址 以 进行 输入 或 输出 操作 。 由 于 该 器 件 有 4 行 ， 


故 需要 两 条 地 址 线 
CS 芯片 选择 。 这 个 低 有 效 的 信号 是 该 器 件 的 主 开 关 。 如 果 C5 为 高 ， 你 就 不 能 对 器 件 进 行 读 写 
Ww 如 果 下 为 高 ， 则 芯片 中 的 数据 可 被 像 计算 机 芯片 这 样 的 外 部 器 件 来 读 。 如 果 页 为 低 ， 数 据 
将 被 写 进 存 储 器 


信号 C3 ( 片 选 ) 如 你 所 猜测 ， 是 全 芯片 的 总 控制 。 没 有 这 个 信号, . 则 这 16 个 D 触 发 器 的 
任何 Q 输 出 都 是 不 能 被 允许 的 ， 所 以 整个 芯片 就 保持 高 阻抗 状态 , 直到 有 外 部 电路 介入 。 这样 ， 
为 了 读 第 一 行 的 数据 ， 不 仅 必须 (A0, A1) = (0, 0)， 还 需要 C5 = 0。 但 等 一 下 ， 还 有 更 多 要 考 
虑 的 ! 

我 们 尚未 完全 解决 问题 的 原因 是 ， 我 们 还 必须 决定 是 要 从 存储 器 中 读 还 是 要 向 存储 器 中 
写 。 如 果 我 们 想 从 存储 器 中 读 ， 我 们 就 要 对 一 行 存储 器 单元 的 4 个 D 触 发 器 的 每 个 Q 输 出 给 巴 
使 能 信号 。 这 意味 着 为 了 从 存储 器 的 任何 一 行 读 出 ， 需 要 下 述 条 件 为 真 ; 

。 从 第 0 行 读 > (A0=0) 且 (Al=0) 且 (C5=0) 且 ( 玫 =1) 

。 从 第 1 行 读 > (A0=1) 且 (Al=0) 且 (C3=0) 且 (到 =1) 

。 从 第 2 行 读 > (A0=0) 且 (A1=1) 且 (C53=0) 且 (到 =1) 

。 从 第 3 行 读 > (A0=1) 且 (Al=1) 且 (C5=0) 且 ( 丈 =1) 

假设 我 们 想 向 第 1 行 写 4 位 数据 。 在 该 例子 中 ， 我 们 不 想 让 单独 的 到 D 触 发 器 的 OE 输入 有 
效 ， 因 为 那 将 打开 三 态 输出 缓冲 器 并 导致 与 我 们 正 要 写 和 存储 器 的 数据 发 生 冲突 。 然 而 ,我 
们 仍然 需要 主 55 信 和 号， 因为 这 可 使 芯片 能 被 写 人 ， 因 此 ， 为 将 4 位 数据 写 人 第 1 行 ， 我 们 需要 
下 面 的 方程 成 立 ; 

写 入 第 1 行 > (A0=1) 且 (Al=0) 月 (C5=0) 且 ( 殉 =0) 

图 6-12 是 一 个 商业 上 使 用 的 存储 器 电路 的 简化 示意 图 ， 它 来 自 总 部 设 在 日 本 的 全 球 电子 
和 半导体 生产 商 NEC 公 司 。 该 器 件 是 一 个 被 组 织 成 512K x 8 位 字 寅 ( 字 节 ) 的 huPD4440081 型 
号 的 4M 位 CMOS 快 速 静态 RAM(SRAM)， 实 际 的 存储 器 阵列 是 由 一 个 有 4 194 304 个 独立 存储 
器 单元 组 成 的 X-Y 和 矩阵 ， 这 正 像 我 们 早先 讨论 过 的 16 位 存储 器 ， 只 是 大 了 许多 。 这 个 电路 有 
19 条 地 址 线 输入 ， 标 记 为 A0..A18。 我 们 需要 这 么 多 的 地 址 线 的 原因 是 28= 524 288， 所 以 19 
条 地 址 线 将 给 出 恰当 的 组 合 数 ， 我 们 需要 这 么 多 组 合 数 来 访问 阵列 中 的 每 个 存储 字 。 

名 字 为 死 的 信号 与 以 前 例子 中 的 下 一样 ， 只 是 标记 不 同 ， 但 仍 需要 一 个 从 低 到 高 的 转 
换 来 写 数 据 。 CS 信号 与 以 前 例子 中 的 C5 信和 号 一 样 ， 有 一 个 不 同 是 商业 部 件 还 提供 了 一 个 明 
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确 的 输出 使 能 信号 (在 图 6-12 中 称 为 CE)， 用 于 在 读 操作 期 间 控制 三 态 输出 缓冲 器 。 在 我 们 
的 例子 中 ， 现 输入 的 状态 就 意味 者 OE 操作。 在 实际 使 用 中 ， 对 OE 进行 独立 控制 的 能 力 有 
助 于 形成 更 灵活 的 部 件 ， 因 此 OE 通常 如 该 例子 这 样 被 加 入 到 存储 器 芯片 。 这 样 ， 你 就 会 看 
到 16 位 存储 器 在 操作 上 与 商业 部 件 一 样 。 

在 继续 讲解 之 前 ， 让 我 们 再 回 到 图 6-11 看 一 下 。 注 意 每 一 行 的 D 触 发 器 所 具有 的 两 个 控 
制 信和 号 是 如 何 进 入 到 每 个 芯片 的 。 一 个 信号 进入 到 0E 三 态 控制 ， 而 另 一 个 进入 到 时 钟 输 
入 。 左 边 模块 内 的 电路 实际 上 是 什么 样 的 呢 ? 如今 ， 你 具有 了 设计 它 所 需要 的 所 有 知识 和 
信息 。 
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4 194 304 位 
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图 6-12 一 个 NECuPD444008 型 号 的 4M 位 CMOS 快 速 静 态 RAM 的 逻辑 图 。 该 图 来 自 NEC 公 司 
注释 : x 为 无 关 项 。 


让 我 们 看 看 该 电路 的 真 值 表 应 该 是 什么 样 的 。 图 6-13 就 是 该 真 值 表 。 

你 可 以 看 到 ， 当 数位 从 16 增 加 到 4 百 万 时 ， 一 个 像 图 6-12 中 真实 存储 器 器 件 PD444008 的 
控制 逻辑 会 变 得 极为 复杂 ， 但 原理 还 是 一 样 的 。 而 且 ， 你 如 果 参 考 图 6-13 就 应 该 会 发 现 ， 译 
码 逻 辑 是 高 度 规整 的 、 可 伸缩 的 ， 这 将 使 硬件 设计 更 为 简明 。 
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图 6-13 16 位 存储 器 译 码 器 的 真 值 表 


数据 总 线 宽 和 可 寻 址 存储 器 


在 继续 考察 具有 更 高 复杂 度 的 存储 器 系统 设计 之 前 ， 我 们 需要 停 下 来 喘 口 气 ， 考 虑 一 些 
额外 的 信息 ， 以 有 助 于 使 接 下 来 的 部 分 更 容易 理解 。 我 们 需要 考察 两 部 分 的 信息 ， 

1. 数据 总 线 宽 

2. 可 寻 址 存储 器 

一 个 计算 机 的 数据 总 线 寅 决定 了 它 在 一 个 操作 或 指令 中 所 能 处 理 的 数字 大 小 。 如 果 我 们 
既 考 虑 嵌入 式 系统 也 车 虑 台式 PC、 服 务 器 、 工 作 站 以 及 大 型 机 ， 我 们 就 会 看 到 一 个 数据 总 线 
宽 的 谱系 ， 从 4 位 宽 直 到 128 位 宽 ，256 位 数据 总 线 宽 刚 刚 问 世 。 你 很 容易 就 会 问 :“ 为 什么 有 
这 么 多 种 宽度 呢 ? ”答案 就 是 速度 和 成 本 的 取舍 。 一 个 有 8 位 数据 通路 连接 到 存储 器 的 计算 机 
可 编程 做 任何 一 个 有 16 位 数据 通路 的 处 理 器 所 能 做 的 任何 事情 ， 只 不 过 需要 更 长 的 时 间 。 考 
虑 这 样 一 个 例子 ， 假 设 我 们 想 将 两 个 16 位 数 加 在 一 起 产生 一 个 16 位 的 结果 ， 要 加 的 数 放 在 存 . 
储 器 中 ， 结 果 也 放 在 存储 器 中 。 对 于 8 位 宽 存储 器 的 情况 ， 我 们 就 需要 将 每 个 16 位 的 字 以 两 个 
连续 的 8 位 字 节 存放 ， 下 面 是 数字 相 加 的 算法 。 

情况 1，8 位 宽 数据 总 线 

1. 从 存储 器 中 取出 第 一 个 数 的 低 字 节 并 放 入 到 一 个 内 部 存储 寄存 器 中 。 

2. 从 存储 器 中 取出 第 二 个 数 的 低 字 节 并 放 入 到 另 一 个 内 部 存储 寄存 器 中 。 

3. 将 两 个 低 字 池 数 相 加 。 

4. 将 低 字 节 相 加 结果 窟 到 存储 器 。 

5. 从 存储 器 中 取出 第 一 个 数 的 高 字 节 并 放 入 到 一 个 内 部 存储 寄存 器 中 。 

6. 从 存储 器 中 取出 第 二 个 数 的 高 字 节 并 放 入 到 另 一 个 内 部 存储 寄存 器 中 。 

7. 将 两 个 高 字 节 数 以 及 前 面 低 字 节 加 操作 的 进位 (如 果 有 的 话 ) 相 加 。 

8. 将 高 字 节 相 加 结果 写 到 存 有 低 字 节 相 加 结果 的 存储 器 位 置 的 下 一 个 位 置 。 

9. 将 进位 (如果 有 的 话 ) 写 到 下 一 个 存储 器 位 置 。 
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情况 2: 16 位 宽 数据 总 线 

1. 从 存储 器 中 取出 第 一 个 数 并 放 入 到 一 个 内 部 存储 寄存 器 中 。 

2. 从 存储 器 中 取出 第 二 个 数 并 放 入 到 另 一 个 内 部 存储 寄存 器 中 。 

3. 将 两 个 数 相 加 。 

4. 将 结果 写 到 存储 器 。 

5. 将 进位 (如 果 有 的 话 ) 写 到 存储 器 。 

如 你 所 见 ， 情 况 1 几乎 需要 2 倍 于 情况 2 的 步 又。 用 更 宽 数据 总 线 所 获得 的 效率 提高 依赖 于 
所 执行 的 算法 ， 其 变化 范围 可 从 小 到 百 分 之 几 的 提高 到 大 到 几乎 4 倍速 度 的 提高 ， 具 体 取决 于 

下 面 是 对 各 种 总 线 宽 的 常用 场合 的 总 结 : 

。4 位 、8 位 : 装置 、 调 制 解 调 器 、 简 单 应 用 

。16 位 : 工业 控制 器 、 汽 车 应 用 

。32 位 : 远程 通信 、 激 光 打印 机 、 台 式 PC 

。64 位 : 高 端 ?C、UNIX 工 作 站 、 游 戏 (任天堂 64) 

。128 位 : 用 于 游戏 的 高 性 能 视频 卡 

。128 位 、256 位 : 下 一 代 超 长 指令 字 (VLIW) 机 器 

有 了 时 我 们 试图 通过 采用 宽 的 内 部 数据 总 线 和 窄 的 存储 器 来 达到 经 济 化 。 例 如 ， 我 们 在 本 
课 中 将 要 学 习 的 Motorola 68000 处 理 器 有 16 位 外 部 数据 总 线 和 32 位 内 部 数据 总 线 。 它 需要 用 两 
次 存储 器 取 操作 将 32 位 数 从 存储 器 中 取出 来 ， 但 一 且 在 计算 机 内 部 进行 操作 ， 它 就 能 处 理 单 
个 的 32 位 值 。 


6.2 地 址 空间 


计算 机 设计 的 下 一 个 考虑 就 是 为 计算 机 配备 多 少 可 寻 址 的 空间 。 计 算 机 的 地 址 空间 
(address space) 的 定义 为 外 部 可 访问 的 存储 数量 。 这 个 地 址 空间 小 到 一 个 简单 器 件 的 1024 字 
节 ， 大 到 一 个 高 性 能 计算 机 的 60GB ， 而 且 ， 一 个 处 理 器 所 能 寻 址 的 存储 量 与 系统 中 实际 的 存 
储量 无 关 。PC 中 的 奔腾 处 理 器 能 寻 址 超过 40 亿 字 节 的 存储 器 ， 但 大 多 数 用 户 的 计算 机 中 很 少 
有 超过 1GB 的 存储 器 。 下 面 是 可 寻 址 存储 器 的 一 些 简 单 例子 : 

* 一 个 简单 的 微 控制 器 (如 在 Mr. Coffee 机 器 中 ) 可 有 10 条 地 址 线 A0.…A9， 能 寻 址 1024 字 
节 的 存储 器 (2 "= 1024)。 
一 个 通用 的 8 位 微 处 理 器 (如 防盗 自动 警 铃 中 的 微 处 理 器 ) 有 16 条 地 址 线 A0…Al15， 能 
寻 址 65 536 字 节 的 存储 器 (216= 65 536)。 
一 个 原始 的 并 引起 PC 革命 的 Intel 8086 微 处 理 器 有 20 条 地 址 线 A0...A19， 能 寻 址 1 048 
576 字 节 的 存储 器 (22=1048 576)。 
Motorola 68000 微 处 理 器 有 24 条 地 址 线 A0...A23， 能 寻 址 16 777 216 字 节 的 存储 器 (224 
=16 777 216)。 

。 奔腾 微 处 理 器 有 32 条 地 址 线 A0...A31， 能 寻 址 4 294 967 296 字 节 的 存储 器 

(232=4 294 967 296 ) 。 

你 马上 就 会 看 到 ， 我 们 通常 根据 字 节 (8 位 值 ) 来 提 及 可 寻 址 存储 器 ， 即 使 存储 器 宽大 于 

8 也 是 这 样 ， 这 就 导致 了 各 种 存储 器 的 寻 址 定义 不 请， 我 们 马上 就 会 遇 到 这 些 问 题 。 


分 页 
假设 你 正在 读 一 本 书 ， 特 别 是 ， 这 还 是 一 本 非常 奇怪 的 书 ， 它 在 每 一 页 恰好 有 100 个 字 ， 
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且 这 些 字 每 一 个 都 是 按 0 到 99 编 号 。 这 本 书 恰好 有 100 页 ， 也 从 0 到 99 编 号 。 速 算 一 下 你 就 会 知 
道 这 本 书 有 10 000 个 字 (100 字 /页 x 100 页 ) ， 而 且 ， 在 每 一 页 的 每 一 个 字 的 紧 接 着 的 地 方 就 是 
该 字 在 全 书 的 绝对 编号 ， 第 0 页 的 第 一 个 数字 给 出 的 是 地 址 0000， 最 后 一 页 的 最 后 数字 给 出 的 
是 9 999。 这 确实 是 一 本 非常 奇怪 的 书 ! 

无 论 如 何 ， 我 们 注意 到 了 相当 有 趣 的 事情 。 一 页 上 的 每 个 字 可 以 用 两 种 方式 在 书 中 唯一 
地 识别 出 来 : 

1. 给 出 字 在 0000 到 9 999 之 间 的 绝对 编号 。 

2. 给 出 该 字 在 从 00 到 99 之 间 的 页 编号 ， 然 后 再 给 出 该 字 在 页 上 从 00 到 99 之 间 的 位 置 。 

这 样 ， 在 第 36 页 上 的 第 45 个 字 就 可 在 绝对 寻 址 中 被 编号 为 3644， 或 者 为 页 号 =36， 偏 移 
=44。 如 你 所 见 ， 无 论 我 们 选择 哪 种 方法 形成 地 址 ， 都 能 找到 正确 的 字 。 如 你 所 预料 到 的 ， 
这 种 类 型 的 寻 址 称 为 分 页 (paging) 。 分 页 要 求 提供 两 个 数字 来 形成 我 们 感 兴趣 的 存储 器 位 置 
的 正确 地 址 : 

1. 存储 器 中 包含 该 数据 的 页 的 页 号 (page number)。 

2. 在 该 页 中 存储 器 位 置 的 页 偏 移 (page offset)。 

图 6-14 给 出 了 一 个 这 样 的 微 处 理 器 方案 (有 时 我 们 将 希腊 字母 “mu” 和 “P” 用 在 一 起 ， 
即 RP， 作 为 微 处 理 器 的 速记 表示 ) : 该 微 处 理 器 有 20 条 地 址 线 A0...A19， 所 以 能 寻 址 1 048 576 
个 字 节 的 存储 器 。 不 幸 的 是 ， 我 们 没有 一 个 正好 匹配 该 处 理 器 存储 地 址 空间 大 小 的 存储 器 芯 
片 ， 这 是 通常 的 情况 ， 所 以 我 们 需要 加 入 额外 的 电路 (并 成 倍增 加 存储 器 设备 ) 来 提供 足够 
的 存储 器 ， 使 得 处 理 器 发 出 的 每 个 可 能 的 地 址 都 能 链接 到 一 个 相应 的 存储 器 位 置 。 





图 6-14 20 位 微 处 理 器 的 存储 器 组 织 。 存 储 空间 被 组 织 成 16 个 64KB 的 存储 页 


由 于 这 个 存储 器 系统 是 用 64KB 存 储 器 件 构建 成 的 ， 所 以 16 个 存储 器 芯片 的 每 一 个 都 有 A0 
到 A15 的 16 条 地 址 线 ， 因 此 ， 从 A0 到 A15 的 每 一 条 地 址 线 都 进入 了 每 个 存储 器 芯片 的 每 个 地 
址 引 脚 。 

来 自 处 理 器 的 剩余 4 条 地 址 线 A16 到 A19 用 于 选择 将 要 寻 址 16 个 存储 器 芯片 中 的 哪 一 个 。 
提醒 一 下 ，4 条 最 高 有 效 的 地 址 线 A16 到 A19 可 有 从 0000 到 1111 (或 十 六 进 制 0 到 F) 的 16 个 组 
合 值 。 

让 我 们 考虑 图 6-14 中 的 微 处 理 器 ， 假 设 它 发 出 十 六 进 制 地 址 9A30D。 来 自 处 理 器 的 最 低 
有 效 地 址 线 A0 到 Al5 都 连接 到 了 16 个 存储 器 件 的 相应 地 址 输入 ， 因 此 ， 每 个 存储 器 件 都 能 看 
到 十 六 进 制 地 址 值 A30D。 地 址 位 A16 到 Al19 到 达 页 选择 电路 。 这 样 ， 我 们 也 许 会 怀疑 系统 究 
竞 能 不 能 工作 和 良好， 每 个 存储 器 件 存储 在 地 址 A30D 的 数据 不 会 互相 干涉 并 给 出 垃圾 数据 吗 ? 

答案 是 否定 的 ， 这 多 亏 每 个 存储 器 芯片 上 的 C3 输入 。 假 设 存储 器 真 想 要 得 到 存储 器 位 置 
9A30D 中 的 字 节 ， 则 其 余 4 条 来 自 处 理 器 的 地 址 线 A16 到 Al19 就 用 于 选择 将 要 寻 址 16 个 存储 器 
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芯片 中 的 哪 一 个 。 记 住 ，4 条 最 高 有 效 地 址 线 A16 到 A19 可 有 从 0000 到 1111 (或 十 六 进 制 0 到 F) 
的 16 个 值 组 合 。 

这 看 起 来 有 些 可 疑 ， 就 像 我 们 先前 讨论 过 的 译 码 器 设计 问题 一 样 。 这 个 存储 器 设计 有 一 
个 4 : 16 译 码 器 电路 用 来 以 4 条 最 高 有 效 地 址 位 进行 页 选择 ， 并 以 其 余 的 16 条 地 址 位 形成 数据 
在 存储 器 芯片 中 的 页 偏 移 。 注 意 ， 同 样 的 地 址 线 A0 到 A15 进 入 到 了 每 个 存储 器 芯片 ， 所 以 ， 
如 果 处 理 器 发 出 十 六 进 制 地 址 E3AB0， 所 有 的 16 个 存储 器 芯片 都 会 看 到 地 址 3AB0。 为 什么 不 
会 出 现 问题 呢 ? 现在 我 确信 你 们 会 异口同声 地 说 : 是 因为 有 三 态 缓冲 器 使 我 们 能 将 这 16 个 页 
连接 到 共同 的 数据 总 线 上 。 地 址 位 A16 到 A19 确 定 了 这 16 个 C5 信号 中 的 哪 一 个 打开 ， 其 余 15 
个 信号 保持 高 状态 ， 所 以 相应 的 那些 芯片 不 会 被 选中 ， 对 数据 传输 没有 影响 。 

分 页 是 计算 机 系统 中 的 一 个 基本 概念 ， 随 着 我 们 对 计算 机 系统 操作 的 进一步 的 探究 ， 这 
个 概念 会 反复 出 现 。 在 图 6-14 中 ， 我们 将 处 理 器 的 20 位 地 址 空间 组 织 成 16 页 ， 每 页 64KB 的 形 
式 。 我 们 这 样 做 的 一 个 可 能 原因 是 我 们 正在 使 用 64K 存 储 器 芯片 ， 这 有 一 定 的 随意 性 ， 因 为 根 
据 能 获得 的 存储 器 件 的 类 型 ， 我 们 还 可 能 以 完全 不 同 的 方式 制定 分 页 方案 。 图 6-15 显 示 出 另 
外 一 种 可 能 的 存储 器 组 织 方式 。 此 外 ， 我 们 还 可 以 从 多 个 芯片 构造 存储 器 的 每 一 页 ， 所 以 这 
些 页 本 身 也 需要 额外 的 硬件 进行 译 码 。 
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图 6-15 一 个 20 位 地 址 空间 的 可 能 分 页 方案 


应 该 强调 的 是 ， 在 计算 机 设计 中 ,一般 来 说 ， 存 储 器 组 织 的 型 式 对 软件 开发 者 应 该 是 透 
明 的 。 硬 件 设计 的 规范 当然 要 为 软件 开发 者 提供 存储 器 映像 ， 为 每 种 存储 器 (如 RAM、ROM.、 
FLASH 等 ) 提供 地 址 范围 。 然 而 ， 软 件 开发 者 无 需 操 心 存 储 器 译 码 是 如 何 组 织 的 。 

从 软件 设计 者 的 角度 来 看 ， 处 理 器 发 出 存储 器 地 址 ， 而 正确 地 解释 该 地 址 并 分 发 到 适当 
的 存储 器 件 则 是 硬件 设计 的 任务 。 

分 页 是 很 重要 的 ， 因 为 它 在 将 微 处 理 器 的 线性 地 址 空间 (linear address space) 映射 到 存 
储 器 件 的 物理 容量 时 是 必要 的 。 有 些微 处 理 器 (如 Intel 8086 及 其 后 继 产品 ) 实际 上 采用 分 页 
作为 主要 的 寻 址 模式 。 外 部 地 址 是 由 来 自 一 个 寄存 器 的 页 号 和 来 自 另 一 个 寄存 器 的 偏 移 值 形 
成 的 。 下 次 你 的 计算 机 崩溃 ， 你 看 到 臭名 昭著 的 “蓝屏 死机 ”时 ， 和 仔细 观察 那个 古怪 的 十 六 
进 制 地 址 ， 你 可 能 会 看 到 : 

BD48: 0056 
这 是 用 页 一 偏 移 表示 的 32- 位 地 址 。 

磁盘 驱动 器 采用 分 页 作为 其 唯一 的 寻 址 模式 ， 每 个 磁盘 被 分 为 5312B 的 扇 区 (页 )。 一 个 
4GB 的 磁盘 有 8 388 608 页 。 
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设计 一 个 存储 系统 


你 也 许 不 同意 ， 但 我 们 就 要 将 学 到 的 知识 整理 起 来 设计 一 个 真实 的 存储 系统 了 。 嗯 ， 也 
许 我 们 还 没有 完全 准备 好 ， 但 也 非常 接近 了 ， 接 近 到 足以 做 一 次 尝试 。 图 6-16 就 是 一 个 具有 
16 位 宽 数据 总 线 的 计算 机 系统 的 示意 图 。 
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图 6-16 一 个 从 4 个 32K x 8 存储 器 芯片 构建 的 64K x 16 存 储 器 系统 的 示意 图 


首先 ， 快速 回忆 一 下 二 进 制 算术 ， 就 像 大 多 数 工程 应 用 一 样 ， 我 们 使 用 速记 符号 “K” 表 
示 1024， 而 不 是 1000。 这 样 ，256K 实 际 上 是 指 262 144 而 不 是 256 000。 通 常 ， 上 下 文 信息 可 
消除 歧义 ， 但 不 总 是 这 样 ， 所 以 要 谨慎 。 

图 6-16 的 电路 看 起 来 比 我 们 迄今 考虑 过 的 任何 电路 都 要 复杂 得 多 ， 但 它 确实 与 我 们 已 经 
学 过 的 电路 没有 多 大 差别 。 首 先 ， 我 们 看 看 这 些 存 储 器 芯片 。 每 个 芯片 有 15 条 地 址 线 输 入 ， 
意味 着 它 有 32K 的 存储 地 址 ， 因 为 2”=32 768。 此 外 ， 每 个 芯片 有 8 条 数据 输入 /输出 (1/O) 线 
进入 其 中 。 然 而 ， 你 应 该 紧 记 ， 图 6-16 的 数据 总 线 实际 上 是 16 位 宽 (D0...D16) 的 ， 所 以 我 们 
实际 上 需要 两 个 8 位 宽 的 存储 器 芯片 来 提供 与 数据 总 线 宽度 匹配 的 正确 存储 器 宽度 。 这 一 点 我 
们 将 在 图 6-17 中 进行 详细 讨论 。 

图 6-16 中 4 个 存储 器 芯片 的 内 部 组 织 与 我 们 已 经 学 过 的 相同 ， 除 了 这 些 器 件 包含 256K 存 储 
单元 ， 而 我 们 在 图 6-11 中 学 过 的 存储 器 有 16 个 存储 单元 。 它 虽然 更 复杂 一 点 ， 但 思想 是 一 样 
的 。 而 且 ， 画 256K 存 储 器 单元 要 比 画 16K 存 储 器 单元 需要 更 多 的 时 间 ， 所 以 我 采取 了 更 容易 
的 方式 。 

在 如 何 加 入 更 多 的 器 件 来 同时 提高 宽度 (数据 总 线 的 大 小 ) 和 深度 (可 得 到 的 存储 位 置 
的 数量 ) 这 个 意义 上 ， 这 个 32K 存 储 位 置 且 每 个 位 置 8 位 宽 的 存 情 器 芯片 的 排列 在 概念 上 与 图 
6-11 中 16 位 的 例子 具有 相同 的 思想 。 在 图 6-11 中 ， 我 们 讨论 了 一 个 16 位 存储 器 ， 它 组 织 成 了 4 
个 存储 位 置 ， 每 个 位 置 4 位 宽 。 在 图 6-16 中 ， 因 为 有 32 768 行 和 8 列 ， 故 在 每 个 芯片 中 总 共有 
262 144 个 存储 单元 。 
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16 位 数据 总 线 ，D0...D15 
图 6-17 扩展 一 个 存储 系统 的 宽度 


每 个 芯片 有 OE 、CS 和 刺 三 个 控制 输入 。 为 了 从 存储 器 件 中 读 ， 我 们 必须 做 如 下 步 晴 : 

1. 将 我 们 要 从 中 读 的 存储 位 置 的 正确 地 址 放 到 A0 到 A14 上 。 

2. 将 CS 置 低 ， 打 开 芯 片 。 

3. 保 持 下 为 高 ， 使 得 不 能 向 芯片 写 。 

4. 将 OE 置 为 低 ， 打 开 三 态 输出 缓冲 器 。 

存储 器 心 片 然后 就 将 数据 从 一 个 芯片 相应 的 存储 器 位 置 放 到 数据 线 D0 到 D7， 从 另 一 个 芯 
片 相应 的 存储 器 位 置 放 到 数据 线 D8 到 D15。 为 了 对 存储 器 件 写 人 ， 我 们 必须 做 如 下 步骤 ， 

1. 将 我 们 要 向 其 中 写 的 存储 位 置地 址 放 到 A0 到 Al4。 

2. 将 CS 置 低 ， 打 开 芯片 。 

3. 将 丈 置 低 ， 使 得 能 向 芯片 写 。 

4. 保持 OE 为 高 ， 使 得 三 态 输出 缓冲 器 无 效 。 

5. 将 数据 放 到 数据 线 DO 到 D15， 其 中 D0 到 D7 到 一 个 芯片 ，D8 到 D15 到 另 一 个 芯片 。 

6. 将 丈 从 低 变 高 ， 将 数据 写 人 相应 的 存储 器 位 置 。 

既然 理解 了 单独 的 存储 器 芯片 如 何 工作 ， 让 我 们 继续 进行 对 电路 整体 的 讨论 。 在 这 个 例 
子 中 ， 微 处 理 器 有 从 A0 到 A23 的 24 条 地 址 线 。A0 到 Al14 直 接 导 入 存储 器 芯片 ， 因 为 每 个 芯片 
有 32KB 的 地 址 空间 。 从 A15 到 A23 这 9 条 最 高 有 效 地 址 位 用 来 为 译 码 逻 辑 块 提供 分 页 信息 。 这 
9 位 告诉 我 们 ， 该 存储 器 空间 可 被 分 成 512 页 ， 每 页 32K 个 地 址 。 然 而 ， 精 明 的 读者 立刻 会 注 
意 到 ， 系 统 中 总 共 只 有 4 个 存储 器 芯片 ， 肯 定 有 什么 地 方 出 了 差错 ! 我 们 没有 足够 的 存储 器 芯 
片 来 充满 512 页 。 唉 ， 真 见鬼 ! 我 真 不 愿意 看 到 这 种 情况 ! ， 

实际 上 ， 这 根本 不 是 一 个 问题 。 它 意味 着 在 512 页 可 寻 址 空间 中 ， 我 们 的 计算 机 有 两 页 真 
实 存储 器 ， 而 另外 的 510 页 只 是 空 页 ， 这 是 一 个 问题 吗 ? 很 难说 。 如 果 我 们 能 够 将 代码 装 入 这 
两 页 而 且 确 实 这 么 做 了 ， 为 什么 还 要 加 入 我 们 用 不 到 的 存储 器 的 成 本 呢 ? 我 可 以 从 个 人 经 验 
告诉 你 ， 为 节省 成 本 ， 在 将 代码 塞 人 较 小 的 存储 器 芯片 方面 已 经 付出 了 很 多 努力 。 

你 要 问 的 另 一 个 问题 是 这 样 的 :“ 好 ， 既 然 uP 的 可 寻 址 空间 不 是 完全 填 满 的 ， 那 么 存储 器 
被 置 于 处 理 器 地 址 空间 的 哪个 地 方 了 呢 ?” 这 是 一 个 非常 好 的 问题 ， 因 为 我 们 目前 还 没有 足够 
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[141| 的 信息 来 回答 这 个 问题 。 但 是 ， 在 尝试 规划 这 个 计算 机 和 存储 系统 之 前 ， 我 们 的 硬件 设计 必 


须要 使 存储 器 芯片 被 正确 地 译 码 为 其 被 设计 到 的 页 位 置 ， 稍 后 我 们 就 会 看 到 这 是 如 何 做 到 的 。 

让 我 们 返回 到 图 6-16。 由 于 数据 总 线 有 16 位 宽 ， 但 每 个 存储 器 芯片 只 有 8 数据 位 宽 ， 所 以 
对 于 每 页 的 存储 ， 我 们 实际 上 需要 两 个 存储 器 芯片 ， 理 解 这 一 点 是 很 重要 的 。 这 样 ， 为 了 建 
造 16 位 宽 存储 器 ， 我 们 需要 两 个 芯片 ， 这 一 点 可 见 图 6-17。 注 意 每 个 存储 器 件 是 如 阿 连接 到 
数据 总 线 中 一 组 8 条 线 的 。 当 然 ， 地 址 总 线 引 脚 A1 到 A14 必 须 连 接 到 地 址 总 线 的 相同 线 上 ， 因 
为 我 们 正 对 两 个 存储 器 芯片 的 相同 地 址 位 置 进行 寻 址 。 

既然 你 已 看 到 两 个 存储 器 芯片 是 如 何 “ 堆 又 ”起 来 形成 一 个 32K x 16 存 储 器 中 的 一 页 ， 采 
用 4 个 芯片 设计 一 个 32K x 32 的 存储 器 对 于 你 就 不 应 是 一 个 问题 了 。 

你 村 能 注意 到 了 ， 这 个 存储 系统 设计 的 例子 中 没有 微 处 理 器 的 时 钟 。 存 储 器 到 处 理 器 作 
为 一 个 计算 机 系统 中 最 重要 的 连接 之 一 ， 需 要 一 个 时 钟 信号 来 对 处 理 器 到 存储 器 进行 同步 。 
事实 上 ， 很 多 存储 器 系统 不 需要 时 钟 信 号 来 确保 可 靠 的 性 能 ， 唯 一 需要 考虑 的 事情 就 是 存储 
器 电路 和 处 理 器 总 线 操作 之 间 的 时 序 关 系 。 在 下 一 章 中 ， 我 们 将 会 更 详细 地 考虑 存储 器 总 线 
周期 ， 这 里 是 一 个 预览 。NEC ukPD444008 有 三 个 型 号 ， 实 际 型 号 的 号 码 是 : 

。MPD444008-8 

。 MPD444008-10 

。MPD444008-12 

数字 后 缀 8、10、12 是 指 每 个 芯片 的 最 大 访问 时 间 (access time)。 访 问 时 间 是 一 个 基本 的 
规范 ， 它 决定 了 一 旦 控制 输入 已 经 正确 地 确立 之 后 , .芯片 能 以 多 快 的 速度 可 靠 地 返回 数据 。 
因此 ,假设 到 芯片 的 地 址 已 稳定 ， CS 和 OF 置 为 有 效 ， 则 在 延 时 8、10、12ns (取决 于 使 用 的 
芯片 型 号 ) 后 ， 数 据 就 可 被 读 入 处 理 器 。 芯 片 生产 商 NEC 保 证 ， 在 芯片 被 设计 时 所 要 求 的 工 
作 温 度 范围 内 ,访问 时 间 是 满足 要 求 的 。 对 于 大 多 数 电子 器 件 ， 商 业 温 度 范 围 是 0 摄氏 度 到 70 
摄氏 度 。 

让 我 们 做 一 个 简单 的 例子 来 理解 其 意义 。 后 面 我 们 还 要 对 此 做 更 详细 的 考察 ， 但 现在 做 
一 下 准备 也 没有 害处 。 假 设 我 们 有 一 个 具有 500MHz 时 钟 的 处 理 器 ， 这 意味 着 每 个 时 钟 周期 是 
2ns。 我 们 的 处 理 器 需要 5 个 时 钟 周 期 来 做 一 次 存储 器 读 ， 在 第 5 个 时 钟 周期 的 下 降 沿 将 数据 读 
入 处 理 器 。 地 址 和 控制 信息 在 第 1 个 时 钟 周期 的 上 升 沿 由 处 理 器 发 出 。 这 意味 着 处 理 器 需要 
4.5x2 即 9ns 的 时 间 做 一 次 存储 器 读 操 作 。 然 而 ， 我 们 还 没有 完全 完成 计算 ， 我 们 的 译 码 逻辑 
电路 也 会 产生 一 些 时 延 。 假 设 从 处 理 器 给 出 控制 信号 和 地 址 信号 到 译 码 逻辑 向 存储 系统 提供 
正确 的 信号 之 间 的 时 间 为 1ns， 这 意味 着 我 们 实际 上 需要 8ns 而 不 是 9ns 准 备 好 数据 。 这 样 ， 只 
有 最 快 型 号 的 产品 (通常 这 意味 着 最 昂贵 的 型 号 ) 才能 在 该 设计 中 可 靠 地 工作 。 

我 们 能 做 什么 吗 ? 我 们 可 以 减 慢 时 钟 。 假 设 我 们 将 时 钟 频率 从 300MHz 改 变 为 400MHz， 
这 就 将 每 时 钟 周 期 加 长 到 2.5ns。 现 在 4.5 个 时 钟 周期 就 需要 11.25ns 而 不 是 9ns ， 减 去 通过 译 码 
逻辑 的 时 延 lns， 我 们 就 需要 一 个 10.25ns 或 更 快 的 存储 器 ， 以 使 得 工作 可 靠 。 这 看 起 来 非常 鼓 
舞 人 心 。 我 们 甚至 可 以 更 多 地 减 慢 时 钟 ， 这 样 就 能 使 用 更 便宜 的 存储 器 件 。 项 目 经 理 能 不 高 
兴 嘛 ! 但 不 幸 的 是 ， 我 们 刚才 只 是 做 了 折 中 ， 这 个 折 中 就 是 我 们 刚才 也 将 处 理 器 减 慢 了 20%。 
处 理 器 做 的 任何 事 现 在 都 要 延长 20% 的 时 间 。 我 们 能 够 忍受 吗 ? 此 时 ， 我 们 也 许 不 知道 。 在 
能 完全 回答 这 个 问题 之 前 ， 我 们 需要 对 代码 的 执行 时 间 和 性 能 需求 做 一 些 谨慎 的 衡量 ， 甚 至 
我 们 接着 会 做 出 一 些 相当 粗略 的 假设 。 

无 论 如 何 ， 以 上 讨论 的 关键 是 在 这 个 存储 系统 的 设计 中 没有 明确 的 时 钟 。 时 钟 依赖 性 是 
隐 含 于 存储 器 到 处 理 器 接口 的 时 序 要 求 中 的 ， 但 时 钟 本 身 并 不 需要 。 在 这 个 特定 的 设计 中 ， 
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我 们 的 存储 系统 异步 地 连接 到 处 理 器 。 

目前 ， 大 多 数 的 PC 存储 器 是 同步 设计 ， 时 钟 信号 是 处 理 器 到 存储 器 接口 的 控制 电路 的 组 
成 部 分 。 如 果 你 曾经 在 你 的 PC 中 加 入 过 存储 “条 ”， 那么 你 就 是 采用 同步 动态 随机 存储 器 
(synchronous dynamic random access memory, SDRAM) 芯片 对 PC 的 能 力 进 行 了 提升 。 印 刷 
电路 板 ( 即 存储 条 ) 就 是 将 存储 芯片 机 械 地 连接 到 PC 母 板 的 方便 方式 .。 

图 6-18 是 一 个 64MB (Mbyte) SDRAM 存 储 器 模块 的 照片 ， ete 被 
组 织 成 1M x 64。 模 块 上 总 共有 16 个 存储 芯片 (正面 和 反面 )， 每 芯片 有 32M 字 的 容量 ， 被 
组 织 成 8M x 4。 我 们 将 在 本 章 的 后 面 看 到 异步 〈 即 静态 ) pe ( 即 动 态 ) 存储 系 
统 之 间 的 差异 。 





图 6-18 64MBSDRAM 存 储 模 块 


真实 存储 系统 中 的 分 页 


图 6-16 中 的 4 个 存储 芯片 给 出 了 两 个 32K x 16 的 存储 页 ， 这 就 留 出 了 510 个 空 的 存储 页 。 我 
们 如 何 知道 在 哪里 找到 这 两 个 存储 页 ， 在 哪里 存储 页 是 空 的 呢 ? 答案 是 这 要 由 你 〈 或 硬件 设 
计 者 ) 来 规定 存储 页 在 哪里 。 你 很 快 就 会 看 到 ， 在 68000 系 统 中 ， 我 们 想 让 ROM 或 FLASH 这 
样 的 非 易 失 性 存储 器 (nonvolatile memory) 处 于 存储 器 的 开始 处 ， 并 从 那里 开始 升 高 地 址 。 
为 做 这 个 练习 ， 我 们 将 真实 存储 器 的 两 个 页 放置 于 第 0 页 和 第 511 页 。 

假设 处 理 器 有 24 个 地 址 位 ， 这 对 应 于 大 约 16M 的 可 寻 址 存储 器 (2* 个 地 址 位 置 )。 习 惯 上 
将 RAM 存 储 器 ( 读 / 写 ) 置 于 存储 器 的 顶端 ， 但 也 不 要 求 一 定 这 样 。 在 多 数 情况 下 ， 这 取决 于 
处 理 器 的 体系 结构 。 在 该 例子 中 ， 我 们 需要 计算 出 这 两 个 真实 存储 页 之 一 如 何 对 从 0x000000 
到 0x007FFF 的 地 址 进行 反应 。 存 储 器 的 前 32K 对 应 于 第 0 页 ， 另 一 个 32K 字 的 存储 区 域 应 置 
于 0xFF8000 到 0xFFFFFF， 即 第 511 页 。 我 们 是 如 何 知道 的 ? 很 简单 ， 就 是 分 页 。 我 们 的 总 
共 16 777 216 字 的 存储 系统 可 被 划分 为 512 页 ， 每 页 32K。 由 于 有 9 位 用 于 分 页 ， 所 以 我 们 能 
将 绝对 地 址 如 表 6-2 那 样 划分 。 


表 6-2 一 个 24 位 寻 址 系统 的 页 号 和 存储 地 址 范围 


页 号 (二进制 ) A23...…...….……… A15 页 号 (十 六 进 制 ) 绝对 地 址 范围 (十 六 进 制 ) 
000000000 000 000000 to 007FFF 
000000001 001 008000 to 00FFFF 
000000010 002 010000 to 017FFF 
000000011 003 018000 to 01FFFF 
111111111 1FF FF8000 to FFFFFF 


二 
当 存 储 地 址 落 在 正确 的 范围 内 时 ， 我 们 想 让 两 个 突出 显示 的 存储 范围 用 CS0 或 CS1 有 效 
来 作出 反应 ， 而 其 他 存储 范围 保持 这 两 个 信号 无 效 。 第 1FF 页 的 译 码 电路 如 图 6-19 所 示 。 第 
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000 页 的 电路 留 给 你 作为 练习 。 

注意 有 一 个 称 为 ADDRVAL (地 址 
有 效 ) 的 新 信号 ， 这 个 地 址 有 效 信号 
(或 某 个 其 他 类 似 的 信号 ) 由 处 理 器 发 
出 ， 用 于 通知 外 部 存储 器 在 总 线 上 的 当 
前 地 址 是 稳定 的 。 为 什么 这 是 必要 的 ? 
记 住 地 址 总 线 上 的 地 址 总 是 在 变化 的 ， 
仅仅 一 条 执行 指令 就 涉及 用 不 同 的 地 址 
值 对 存储 器 进行 5 次 或 更 多 次 的 访问 。 
地 址 停留 时 间 越 长 ， 处 理 器 的 性 能 就 越 、 
低 ， 因 此 ， 处 理 器 必须 向 存储 器 发 出 当 图 019 mm 
前 地 址 值 正确 的 信号 ， 然 后 存储 器 对 此 
作出 反应 。 此 外 ， 有 些 处 理 器 可 能 有 RD 和 WR 两 个 独立 的 信号 ， 分 别 表 示 读 操作 和 写 操作 ， 
另外 一 些 处 理 器 只 有 单一 的 信号 线 R/W 。 每 个 方法 都 有 其 优势 和 缺点， 我 们 在 此 不 必 考 虚 。 现 
在 ， 我 们 假设 处 理 器 有 两 个 独立 的 信号 ， 一 个 用 于 读 操作 ， 一 个 用 于 写 操作 。 

正如 你 从 图 6-16 中 和 从 存储 器 芯片 如 何在 系统 中 工作 的 讨论 中 所 了 解 的 ， 显 而 易 见 ， 我 
们 可 以 将 对 存储 器 进行 读 和 写 的 必要 逻辑 条 件 表 达 如 下 : 

存储 器 读 = OE*CS*WR 
存储 器 写 = OE*CS*WR 
在 这 两 种 情况 下 ， 我 们 都 需要 使 CS 信号 有 效 以 对 存储 器 进行 读 或 写 。 正 是 对 芯片 使 能 (或 芯 
片 选择 ) 信和 号 的 控制 ， 才 使 我 们 能 控制 在 处 理 器 存储 空间 的 哪个 区 域 的 特定 存储 芯片 能 变 成 
除了 对 SDRAM 存 储 器 做 了 简要 介绍 , 我 们 只 考虑 了 用 静态 RAM (SRAM) 作为 存储 器 件 。 
如 你 所 见 ， 静 态 RAM 源 自 忆 触发 器 。 它 与 处 理 器 的 接口 相对 简单 ， 因 为 我 们 所 要 做 的 事 就 是 
给 出 地 址 和 适当 的 控制 信号 ， 等 待 适当 的 时 间 ， 然 后 就 能 读 或 写 存 储 器 。 如 果 我 们 长 时 间 不 
访问 存储 器 也 没有 问题 ， 因为 只 要 对 电路 施加 了 电源 ， 触 发 器 门 设计 的 反馈 机 制 就 能 正确 地 
保持 数据 。 然 而 ， 我 们 不 得 不 为 这 种 简单 性 付出 代价 ， 一 个 现代 的 SRAM 存 储 器 单元 需要 5 或 
6 个 晶体 管 来 实现 实际 的 门 设计 。 当 你 在 谈论 关于 存储 256M 位 数据 的 存储 世 片 时 ， 6 个 晶体 管 
的 存储 单元 就 占用 了 大 量 宝贵 的 硅 片 ( 硅 模 ) 空间 。 

目前 ， 计 算 机 〈 像 你 的 PC) 中 的 大 多 数 高 密度 存储 器 采用 的 都 是 另外 一 种 不 同 的 存储 技 
术 ， 称 为 动态 RAM， 即 DRAM。DRAM 单 元 要 比 SRAM 单 元 小 得 多 ， 典 型 情况 是 每 个 单元 只 
用 一 个 晶体 管 。 一 个 晶体 管 不 足以 生成 在 单元 中 存储 数据 所 需 的 反馈 电路 ， 所 以 DRAM 采 用 
了 一 种 完全 不 同 的 机 制 ， 这 个 机 制 称 为 存储 电荷 (stored charge)。 

如 果 你 曾经 在 冬季 干燥 的 一 天 走 过 一 个 地 毯 ， 然 后 又 接触 到 类 似 冰 箱 的 某 金 属 时 受到 了 
电击 ， 那 么 你 就 熟悉 存储 电荷 了 。 当 你 走 过 地 毯 时 ， 你 的 身体 拾取 了 过 多 的 电荷 (现在 你 代 
表 逻 辑 1 状 态 ) ， 然 后 当 电荷 离开 你 的 身体 时 你 受到 电击 ， 你 就 回 到 了 逻辑 0 状态 。DRAM 单 元 
恰 以 同样 的 方式 工作 。 每 个 DRAM 单 元 都 能 存储 少量 电荷 ， 可 被 DRAM 电 路 检测 为 1。 存 储 一 
些 电 荷 ， 单 元 是 逻辑 1， 消 除 电 荷 ， 单 元 就 是 逻辑 0。( 然 而 ， 就 像 电 荷 存储 于 你 的 身体 一 样 ， 
如 果 你 不 做 任何 事情 来 补充 电荷 ， 那 么 电荷 最 终 会 泄漏 完 。) 这 有 点 更 复杂 了 ， 存 储 的 电荷 最 
终 会 代表 0 而 不 是 1， 但 这 已 足够 使 我 们 理解 这 个 概念 了 。 


ADDR VAL 
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对 于 一 个 DRAM 单 元 的 情况 ， 我 们 补充 电荷 的 方式 就 是 周期 性 地 读 单元 ， 所 以 ，DRAM 
的 命名 就 是 取 自 于 我 们 经 常 地 对 其 进行 读 操作 的 事实 ， 即 使 我 们 实际 上 并 不 需要 存储 在 其 中 
的 数据 ， 这 就 是 DRAM 名 字 中 动态 部 分 的 意思 。 从 单元 中 读 的 过 程 称 为 刷新 周期 (refresh 
cycle)， 必 须 在 时 间 空 隙 中 完 成 。 事 实 上 ，DRAM 的 每 个 单元 必须 每 几 毫 秒 刷新 一 次 ， 否 则 单 
元 就 有 失去 其 数据 的 危险 。 图 6-20 显 示 出 64M 位 DRAM 存 储 器 组 织 的 示意 图 。 

存储 器 被 组 织 成 8192 行 x 8192 列 


的 矩阵 (2”)。 为 了 对 任 一 DRAM 存 ousom on | 
储 单元 进行 唯一 寻 址 , 需要 26 位 地 址 。 (0.0) On) 一 ~ 一 0.8191) 


由 于 我 们 已 经 将 其 建造 成 矩阵 ， 而 且 4o 口 口 口 口 
封装 上 的 26 个 引 脚 会 引入 额外 的 复杂 
性 ， 所 以 就 通过 对 XY 拢 阵 提 供 一 个 “13 行 地 址 线 
独立 的 行 地 址 和 一 个 独立 的 列 地 址 来 。 RA0.…RA12 


对 存储 器 进行 寻 址 。 对 我 们 来 说 幸运 上 oo OD 


的 是 ， 产 生 这 些 地 址 的 过 程 是 由 置 于 (81910) 口 口 ------------ 口 口 
PC 母 板 上 的 特殊 芯片 组 来 处 理 的 。 (8191,8191) 
让 我 们 回 到 刷新 闻 题 。 假 设 我 们 必须 图 6-20 64M 位 DRAM 存 储 器 的 组 织 


在 每 10ms 对 64M 单 元 至 少 刷 新 一 次 ， 
这 是 否 意味 着 我 们 必须 做 64M 次 刷新 周期 呢 ? 实际 上 不 需要 。 只 要 向 存储 器 发 出 行 地 址 就 足够 
保证 该 行 的 所 有 8192 个 单元 被 立即 刷新 。 现 在 我 们 的 问题 就 更 容易 处 理 了 ， 举 个 例子 ， 如 果 设 
计 规 范 给 我 们 16.384ms 来 刷新 存储 器 中 的 8192 行 ， 则 我 们 必须 平均 在 每 16.384 x 10-3/8.192 x 103 
秒 刷新 一 行 ， 即 每 两 微妙 刷新 一 行 。 

所 有 这 些 看 起 来 很 复杂 ， 确 实 是 这 样 的 。 设 计 一 个 DRAM 存 储 系统 不 适合 于 一 个 初学 的 
硬件 设计 者 ，DRAM 引 入 了 若干 个 新 级 别 的 复杂 性 : 

* 我们 必须 将 总 体 地 址 分 裂 为 一 个 行 地 址 和 一 个 列 地 址 。 

。 我 们 必须 在 每 大 约 1us 左 右 停止 访问 存储 器 ， 并 做 一 个 刷新 周期 。 

。 如 果 处 理 器 需要 使 用 存储 器 ， 而 刷新 也 需要 访问 存储 器 ， 我 们 就 需要 某 种 方式 来 同步 

两 个 竞争 的 过 程 。 . 

这 使 得 将 DRAM 与 现代 处 理 器 进行 接口 成 了 一 个 相当 复杂 的 操作 。 但 幸运 的 是 ， 现 代 的 
支持 芯片 组 (support chip set) 能 很 好 地 处 理 这 个 问题 。 而 且 ， 如 果 每 两 微 秒 必须 做 一 次 刷新 
有 些 过 多 ， 那 么 别 忘 了 你 的 2GHz 的 Athlon 或 奔腾 处 理 器 在 每 微 秒 发 出 的 4 000 个 时 钟 周期 ， 所 
以 在 需要 做 一 次 刷新 周期 前 我 们 能 做 很 多 处 理工 作 。 

竞争 的 存储 器 访问 操作 ( 读 、 写 及 刷新 ) 所 引起 的 冲突 问题 在 很 大 程度 上 被 缓解 了 ， 因 
为 现代 PC 处 理 器 包含 称 为 cache 的 片上 存储 器 。 我 们 将 在 后 面 章节 中 更 详细 地 讨论 cache， 但 
现在 我 们 在 片 外 DRAM 存 储 器 上 就 能 看 到 cache 的 影响 ， 这 个 影响 就 是 大 大 地 降低 了 处 理 器 对 
外 部 存储 系统 的 要 求 。 

我 们 将 要 看 到 ， 处 理 器 所 需要 的 指令 和 数据 已 在 cache 中 的 概率 通常 大 于 90% ， 虽 然 精确 
的 概率 受 运行 算法 的 影响 。 这 样 ， 只 有 10% 的 时 间 处 理 器 需要 转 到 外 部 存储 器 来 访问 没有 在 
cache 中 的 数据 或 指令 。 在 现代 处 理 器 中 ， 数 据 在 外 部 存储 系统 和 处 理 器 之 间 的 传输 是 成 组 的 
(in bursts) ， 而 不 是 一 次 传输 一 个 字 节 或 一 个 字 。 成 组 访问 是 非常 高 效 的 数据 传输 方式 ， 事 实 
上 ， 你 可 能 已 经 很 熟悉 这 个 概念 了 ， 因 为 你 PC 中 的 很 多 其 他 系统 也 依赖 于 成 组 数据 传输 。 例 
如 ， 你 的 硬盘 驱动 器 每 次 以 一 个 扁 区 为 一 组 的 方式 将 数据 传送 到 存储 器 。 如 果 你 的 计算 机 连 
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接 到 一 个 10Base-T 网 络 或 100Base-T 网 络 ， 则 它 一 次 能 处 理 256 个 字 节 的 数据 包 。 系 统 资源 若 


一 次 只 传输 一 个 字 节 就 太 低 效 太 浪费 了 。 

SDRAM 存 储 器 还 被 用 来 高 效 地 与 带 有 片上 cache 的 处 理 器 进行 接口 ， 特别 是 用 于 存储 器 
与 处 理 器 片上 cache 之 间 的 成 组 访问 。 图 6-21 是 从 一 个 SDARM 存 储 器 件 的 数据 单 所 摘录 的 一 
个 选段 。 访 器件 来 自 Micron Technology@ 公 司 ， 这 是 一 个 位 于 爱 达 荷 州 Boise 的 半导体 存储 器 
制造 商 。 这 个 时 序 图 是 MT48LC128MXA22 系 列 SDRAM 存 储 器 的 ， 这 种 器 件 是 512M 位 的 ， 可 
被 组 织 成 4 位 宽 、8 位 宽 或 16 位 宽 的 数据 通路 ,“X” 是 为 组 织 4 位 宽 、 8 位 宽 或 16 位 宽 ) 而 加 
入 的 占 位 符 。 这 样 ， MT48LC128M4A2 就 被 组 织 成 32M x 4， 而 MT48LC128M16A2 则 被 组 织 
成 8M x 16。 


To 人 Te T3 T4 T5 T6 


CLK | | | | | | | | | | | | | | 
1 1 1 1 1 


1 . E ' 1 1 
1 
COMMAND 人 (RE ror M vor ror XXX 从 ror 人 | 
， 










ADDRESS 


pa 一 

” CAS Latency =2 

图 6-21 成 组 存储 器 访问 的 时 序 图 ， 是 针对 Micron Technology 公 司 部 件 编号 为 MT48LC128MXA2 
的 SDRAM 存 储 器 芯片 的 。 该 图 来 自 Micron Technology 公 司 


这 些 器 件 在 操作 上 要 比 我 们 迄今 所 看 到 的 简单 SRAM 存 储 器 要 复杂 得 多 。 然 而 ， 我 们 在 
图 6-21 中 就 能 看 到 基本 的 成 组 传输 行为 。 

标记 为 COMMAND、ADDRESS 和 DQ 的 域 表 示 的 是 数据 带 而 不 是 单个 位 。 这 是 一 个 简化 ， 
能 使 我 们 显示 1 组 信号 ， 如 14 个 地 址 位 ， 而 不 必 显 示 每 个 单独 信号 的 状态 。 这 个 带 用 于 显示 信 
号 在 哪里 必须 是 稳定 的 ， 在 哪里 才 允 许 变化 。 注 意 所 有 信号 是 如 何 在 时 钟 的 上 升 沿 被 同步 的 。 
一 旦 发 出 READ 命 令 ， 而 且 提供 了 成 组 传输 起 始 处 的 地 址 ， 就 有 两 个 时 钟 周 期 的 等 待 时 间 ， 然 
后 在 每 个 接续 的 时 钟 周期 ， 就 可 持续 地 得 到 芯片 中 存储 的 数据 。 显 然 ， 这 远 比 一 次 读 一 个 字 
节 要 有 效率 。 

当 我 们 更 详细 地 考察 cache 存 储 器 时 ， 我 们 会 看 到 片上 cache 也 被 设计 成 用 外 部 存储 器 以 成 
组 数据 的 方式 填充 。 这 样 ， 我 们 在 不 得 不 为 从 外 部 存储 器 到 片上 cache 的 数据 传输 建立 初始 条 
件 而 招致 惩罚 ， 但 一 旦 装 入 了 传输 参数 ， 存储 器 到 存储 器 的 数据 传输 就 可 相当 快速 地 进行 。 
对 于 该 系列 的 器 件 ， 数 据 传 输 能 以 133Hz 的 最 大 时 钟 速率 进行 。 

更 新 的 SDRAM 器 件 称 为 双 数 据 速 率 (double data rate, DDR) 芯片 ， 在 时 钟 的 上 升 沿 和 
下 降 沿 都 能 传输 数据 。 这 样 ， 一 个 具有 133MHz 时 钟 输入 的 DDR 芯 片 就 能 以 266MHz 的 速度 传 
输 数 据 。 这 些 部 件 以 未 知 的 原因 被 指定 为 PC2700 器 件 ， 任何 SDRAM 芯 片 ， 只 要 能 遵照 
266MHz 的 时 钟 速率 就 是 PC2700。 

现代 DRAM 设 计 呈 现 出 很 多 不 同 的 形式 。 我 们 一 直 在 讨论 SDRAM， 因为 这 是 在 现代 PC 
中 最 常见 形式 的 DRAM。 你 的 图 形 卡 包含 视频 DRAM ， 较 旧 的 PC 包含 扩展 数据 输出 
(extended data out, EDO) DRAM。 目 前 ,最 常见 的 SDRAM 类 型 就 是 DDR SDRAM。 其 中 最 
令 人 惊异 的 事情 是 这 种 类 型 存储 器 的 令 人 难以 置信 的 低 成 本 。 在 写本 书 的 时 候 (2004 年 夏 )， 
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你 可 以 花 大 约 每 兆 字 节 10 美 分 的 价格 买 到 512MB 的 SDRAM。 一 个 具有 相同 容量 的 静态 RAM 
存储 器 的 价格 则 超过 了 2 000 美 元 。 


存储 器 到 处 理 器 的 接口 


本 章 我 们 要 解决 的 最 后 一 个 主题 涉及 存储 系统 与 处 理 器 如 何 进行 相互 通信 的 细节 。 诚 然 ， 
我 们 可 以 简略 地 介绍 一 下 ， 因 为 在 当今 世界 上 已 有 超过 300 种 的 商业 微 处 理 器 系列 ， 所 以 关于 
一 个 主题 有 太 多 的 变化 。 让 我 们 尝试 采用 概括 的 看 法 而 不 过 深 地 陷入 个 别 差 异 中 。 

一 般 来 说 ， 大 多 数 基 于 微 处 理 器 的 系统 包含 三 个 主要 的 总 线 组 : 

。 地址 总 线 : 一 个 从 处 理 器 到 存储 器 的 单 向 总 线 。 

。 数据 总 线 : 一 个 双向 总 线 ， 它 在 读 操作 期 间 将 数据 从 存储 器 运送 到 处 理 器 ， 在 写 操作 

期 间 将 数据 从 处 理 器 运送 到 存储 器 。 
*。 状态 总 线 : 一 个 异 质 总 线 ， 由 各 种 控制 和 内 务 处 理 信号 组 成 ， 这 些 信号 用 于 协调 处 理 
器 、 存 储 器 以 及 其 他 外 设 的 操作 。 典 型 的 状态 总 线 信号 包括 : 

a. 复位 

b. 中 断 管理 

c. 总 线 管理 

d. 时 钟 信号 

e. 读 信号 和 写 信号 

Motorola” MC68000 处 理 器 的 这 些 信 号 都 在 图 6-22 中 。 该 68000 处 理 器 有 24 位 地 址 总 线 和 
16 位 外 部 数据 总 线 。 然 而 在 内 部 ， 地 址 和 数据 总 线 可 达 32 位 宽 。 我 们 将 在 本 节 的 后 面 讨论 中 
断 系统 和 总 线 管理 系统 。 


16MB 地 址 空间 





数据 总 线 : 
到 存储 器 
从 存储 器 输入 


MC68000 





图 6-22 Motorola 68000 处 理 器 的 三 个 主要 总 线 

* Motorola 公 司 最 近 将 其 半导体 产品 部 门 (SPS) 分割 出 来 形成 了 一 个 新 的 公司 一 Freescale 公 司 。 但 是 ， 老 习 

惯 很 难 改变 ， 所 以 我 们 继续 将 源 于 68000 体 系 结构 的 处 理 器 称 为 Motorola MC68000 

地 址 总 线 是 所 有 单个 地 址 线 的 集 总 ， 我 们 之 所 以 说 它 是 同 质 总 线 (homogeneous bus)， 
是 因为 构成 总 线 的 所 有 单独 信和 号 都 是 地 址 线 ， 地 址 总 线 也 是 单 向 的 ， 地 址 由 处 理 器 生成 并 送 
到 存储 器 。 存 储 器 不 生成 任何 地 址 并 通过 总 线 将 它们 送 到 处 理 器 。 

数据 总 线 也 是 同 质 的 ， 但 它 是 双向 的 。 数 据 通过 读 操作 从 存储 器 送 到 处 理 器 ， 通 过 写 操 
作 从 处 理 器 送 到 存储 器 。 这 样 ， 数 据 可 在 两 个 方向 中 的 任 一 方向 流动 ， 具 体 流动 方向 取决 于 
被 执行 的 指令 。 
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状态 总 线 是 异 质 的 (heterogeneous) ， 它 由 不 同 种 类 的 信号 构成 ， 所 以 我 们 不 能 像 对 地 址 
总 线 和 数据 总 线 一 样 对 其 进行 聚合 。 而 且 ， 一 些 信号 是 单 向 的 ， 另 一 些 信号 是 双向 的 。 状 态 
总 线 是 “内 务 管理 ”总 线 。 所 有 在 控制 系统 操作 方面 也 需要 的 信号 就 被 归 人 到 状态 总 线 。 

现在 ， 让 我 们 考察 这 些 总 线 上 的 信号 如 何 同 存储 器 一 起 工作 ， 使 得 我 们 能 够 读 和 写 。 
图 6-23 显 示 了 存储 器 接口 的 处 理 器 这 一 侧 。 


存储 器 写 周期 
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图 6-23 一 个 典型 微 处 理 器 的 时 序 图 


现在 我 们 就 能 看 到 处 理 器 和 时 钟 如 何 一 同 工 作 来 为 存储 器 数据 访问 进行 定 序 。 虽 然 开 始 
时 这 可 能 看 起 来 很 令 人 困惑 ， 但 它 实际 上 非常 简单 易 懂 。 图 6-23 是 处 理 器 的 一 个 “简化 的 ” 
时序 图 ， 我 们 已 经 忽略 了 很 多 在 各 种 处 理 器 中 可 能 出 现 或 不 出 现 的 附加 信号 ， 并 力图 将 我 们 
的 讨论 限制 在 本 质问 题 上 。 

Y 轴 显示 了 来 自 处 理 器 的 各 种 信号 。 为 简化 ， 我 们 将 所 有 的 地 址 总 线 和 数据 总 线 组 合成 信 
号 “ 带 ”。 遵 照 这 种 方式 ， 在 任意 给 定时 间 ， 我 们 可 假设 一 些 是 1 一 些 是 0， 但 关键 问题 是 我 们 
必须 规定 它们 什么 时 候 是 有 效 的 。 地 址 总 线 和 数据 总 线 中 的 交叉 点 X 是 时 间 点 的 符号 表示 ， 表 
示 总 线 上 的 地 址 和 数据 可 能 正在 变化 ， 比 如 地 址 正 变 为 一 个 新 的 值 ， 或 者 数据 正 来 自 处 理 器 。 

由 于 微 处 理 器 是 一 个 状态 机 ， 所 以 任何 事情 都 用 时 钟 的 边沿 同步 。 一 些 事件 在 上 升 沿 发 生 ， 
而 一 些 则 可 能 用 下 降 沿 同步 。 此 外 ， 为 了 方便 ， 我 们 将 总 线 周 期 划分 成 可 识别 的 时 间 标 签 ， 称 
为 “T 状 态 ”。 不 是 所 有 的 处 理 器 都 以 这 种 方式 工作 ， 但 这 是 很 多 处 理 器 实际 如 何 工 作 的 一 个 合 
理 近 似 。 要 记 住 的 是 处 理 器 总 是 运行 这 些 总 线 周期 ,这些 操作 形成 了 处 理 器 和 存储 器 之 间 交 换 
数据 的 基本 方法 ， 所 以 ， 我 们 就 能 回答 本 章 开始 时 提出 的 一 个 问题 。 回 忆 一 下 ， 操 作 ADD B, A 
的 状态 机 真 值 表 省 去 了 首先 数据 如 何 进 入 寄存 器 ， 以 及 指令 本 身 如 何 进入 计算 机 的 任何 解释 。 

这 样 ， 在 考察 处 理 器 /存储 器 接口 的 时 序 图 之 前 ， 我 们 需要 提醒 我 们 自己 ， 接 口 的 控制 是 
由 状态 机 的 另 一 个 部 分 操纵 的 。 用 算法 的 术语 来 说 ， 就 是 我 们 对 状态 机 操纵 存储 器 接口 的 部 
分 做 了 一 次 “函数 调用 ”， 数 据 由 该 算法 来 读 或 写 。 

让 我 们 从 读 周 期 开始 。 在 T1 中 时 钟 的 下 降 沿 期 间 ， 地 址 变 得 稳定 ， ADDRVAL 信 号 变 为 
低 ， 成 为 有 效 状态 。 而 且 ， RD 信号 变 低 ， 指 明 这 是 一 个 读 操作 。 在 T3 的 下 降 沿 ， 读 和 地 址 
有 效 信号 取消 ， 向 存储 器 指明 该 周期 正在 结束 ， 来 自 存储 器 的 数据 正在 被 处 理 器 读 。 这 样 ， 
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存储 器 必须 能 在 两 个 全 时 钟 周期 内 〈T2 的 全 部 加 上 半 个 T1 和 半 个 T2) 提供 数据 给 处 理 器 。 

假设 存储 器 没有 快 到 足以 保证 数据 能 及 时 准备 好 ， 我 们 针对 NEC 静 态 RAM 芯 片 的 例子 讨 
论 这 种 情况 ， 并 判定 一 个 可 行 的 解决 方案 就 是 减 慢 处 理 器 的 时 钟 直到 存储 器 的 访问 时 间 要 求 
确保 在 规定 范围 内 。 现 在 ， 我 们 将 考虑 另 一 种 方案 。 在 这 个 方案 中 ， 存 储 系统 可 返回 给 处 理 
器 WAJT 有 效 信号 ， 处 理 器 在 T2 周 期 期 间 的 时 钟 下 降 治 检查 WAIT 信号 的 状态 。 如 果 WAIT 信 
号 有 效 ， 处 理 器 就 生成 另 一 个 T2 时 钟 并 再 次 进行 检查 。 只 要 WAIT 信号 为 低 ， 处 理 器 就 保持 
在 T2 的 标记 时 间 ， 只 有 当 WAIT 变 高 处 理 器 才 完 成 该 总 线 周期 ,这 称 为 等 待 状态 (wait state)， 
用 于 将 较 慢 的 存储 器 与 较 快 的 处 理 器 同步 。 

写 周 期 与 读 周期 类 似 。 在 Tl 中 时 钟 的 下 降 沿 期 间 ， 地 址 变 为 有 效 。 在 T2 中 时 钟 上 升 沿 期 
间 ， 要 写 的 数据 被 放 到 数据 总 线 上 ， 并 且 写 信号 变 低 ， 指 明 这 是 一 个 存储 器 写 操作 。 在 写 周 
期 ，WAIT 信号 在 T2 有 相同 的 功能 。 在 T3 中 时 钟 下 降 沿 期 间 ， WR 信号 被 取消 ， 给 了 存储 器 
一 个 上 升 沿 来 存储 数据 。 ADDRVAL 也 被 取消 ， 写 周期 结束 。 

在 我 们 继续 讨论 之 前 ， 还 有 几 个 有 趣 的 概念 需要 解释 一 下 ， 它 们 在 以 前 的 讨论 中 被 忽略 了 。 
第 一 个 就 是 在 时 钟 的 两 个 边沿 都 操作 的 状态 机 的 思想 ， 我 们 先 考 虑 这 一 点 。 当 我 们 为 了 同步 其 内 
部 操作 而 给 处 理 器 输入 单个 时 钟 信号 时 ， 我 们 并 不 是 真正 地 看 到 了 对 于 内 部 时 钟 发 生 了 什么 。 很 
多 处 理 器 会 在 内 部 将 时 钟 转换 成 2- 相 时 钟 (2-phase clock)。 图 6-24 显 示 了 一 个 2- 相 时 钟 的 时 序 图 。 
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图 6-24 一 个 2- 相 时 钟 的 时 序 图 

在 图 6-24 中 ， 一 个 由 外 部 震荡 器 生成 的 输入 时 钟 被 转换 成 2- 相 时 钟 ， 标 记 为 1 和 中 2。 这 
两 个 时 钟 的 相 彼 此 在 相位 上 相差 180"， 所 以 CLK- IN 信 号 的 每 个 上 升 沿 或 下 降 沿 都 产生 了 一 个 
内 部 的 时 钟 上 升 沿 。 我 们 如 何 能 生成 一 个 2- 相 时 钟 呢 ? 你 实际 上 已 经 知道 如 何 做 了 ， 但 还 有 
一 点 知识 我 们 需要 知道 。 图 6-25 就 是 能 用 来 产生 2- 相 时 钟 的 电路 。 
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图 6-25 一 个 2- 相 时 钟 生 成 电路 

因为 通常 使 用 的 集成 电路 部 件 有 在 一 个 封装 中 包含 4 个 异 或 门 的 ， 所 以 4 个 异 或 门 很 方便 
使 用 。 该 电路 利用 了 逻辑 门 固有 的 传播 延迟 ， 假 设 每 个 异 或 门 的 传播 延迟 是 10ns。 假 设 时 钟 
输入 为 低 ， 异 或 门 1 到 3 的 一 个 输入 永久 性 地 接地 〈 膛 辑 低 ) 。 由 于 门 1 的 两 个 输入 均 为 低 ， 其 
输出 也 为 低 。 这 种 情况 对 门 2、3、4 也 是 一 样 。 现 在 ，CLK IN 逻辑 状态 变 为 高 。 门 并 4 的 输出 
在 10ns 后 变 为 高 并 使 D 触 发 器 状态 翻转 。 由 于 Q 和 C 输 出 彼此 是 相反 的 ， 所 以 我 们 通过 利用 D 
触发 器 的 二 分 连 线 的 特性 就 能 很 便利 地 拥有 两 个 交替 的 时 钟 相位 源 。 

在 30ns 的 传播 延迟 之 后 ， 门 并 3 的 输出 也 变 为 高 ， 这 导致 异 或 门 并 4 的 输出 再 次 变 低 ， 这 
是 因为 若 异 或 门 的 两 个 输入 相同 ， 其 输出 就 为 低 ， 不 同 则 异 或 门 的 输出 就 为 高 。 在 后 面 的 某 
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个 时 间 ， 时 钟 输入 再 次 变 低 ， 我 们 就 在 门 #4 的 输出 端 生成 男 一 个 30ns 宽 的 正 脉 冲 ， 因 为 在 
30ns 后 ， 两 个 输出 均 不 同 。 这 就 
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导致 D 触 发 器 在 时 钟 的 两 个 边沿 。 妆 
者 翻转， 而 Q 和 互 输 出 就 给 出 我 ”三 | 十 上 二 
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个 2- 相 时 钟 输出 ， 其 中 两 个 相位 A 
徙 此 正好 相差 180 度 。 图 6-26 个 2- 相 了 时钟 生 成 电路 的 波形 

现在 我 们 就 能 重新 考察 图 6-23 并 领会 隐藏 在 图 中 的 另 一 个 微妙 的 地 方 了 。 由 于 我 们 明显 是 在 时 
钟 的 上 升 沿 和 下 降 沿 改变 状态 的 ， 所 以 我 们 就 知道 处 理 器 的 内 部 状 Wa 
态 机 实际 上 使 用 的 是 一 个 2- 相 时 钟 ， 这 些 “T” 状 态 中 的 每 一 个 实 和) 
际 上 都 是 两 个 状态 。 这 样 ， 我 们 就 能 将 读 周 期 的 时 序 图 重 画 为 一 个 Cn CT C0) 
状态 图 ， 它 能 清楚 地 表明 等 待 状态 开始 活动 的 方式 。 图 6-27 显 示 出 < 
总 线 周期 中 读 这 一 相 的 状态 图 表示 。 Gs)) 地 C2)) 

参见 图 6-27， 我 们 能 清楚 地 看 到 ， 在 状态 T21， 处 理 器 测 ”图 6.27 一 个 处 理 器 读 周期 
试 WA1T 输入 的 状态 。 如 果 该 输入 为 低 , 处理 器 就 保持 在 T21 状 态 ， 的 状态 图 
有 效 地 延长 了 总 线 周期 的 时 间 。 与 降低 时 钟 频率 相 比 ， 等 待 状态 
的 优势 是 我 们 能 将 系统 设计 成 只 有 在 处 理 器 访问 某 存储 器 区 域 时 才 招 致 等 待 的 惩罚 ， 而 不 是 
对 所 有 操作 都 减 慢 速度 。 我 们 现在 将 整个 总 线 读 周期 总 结 如 下 ; 

。T10: 读 周 期 开始 。 处 理 器 为 读 操作 输出 新 的 存储 器 地 址 。 

。T11: 地 址 此 时 稳定 ， ADVAL 变 为 低 。 RD 变 为 低 ， 指 明 读 周 期 正在 开始 。 

。T20: 读 周期 继续 。 

。T21: 处 理 器 对 WAJT 输入 采样 。 如 果 有 效 则 T21 周 期 继续 。 

。T30: 读 周期 继续 。 

。T31: 读 周期 结束 。 ADVAL 和 并 取消 ， 处 理 器 从 存储 器 输入 数据 。 


6.3 直接 存储 器 访问 


我 们 将 以 对 另 一 种 形式 存储 器 访问 的 简要 讨论 结束 第 6 章 ， 该 种 访问 形式 称 为 DMA， 即 
直接 存储 器 访问 (direct memory access, DMA)。 对 DMA 系 统 的 需要 是 得 自 于 存储 系统 和 处 理 
器 通过 总 线 互 连 这 样 一 个 事实 。 由 于 总 线 是 进出 系统 的 唯一 路 径 ， 当 外 部 设备 如 硬盘 驱动 器 
或 网 卡 携 有 处 理 器 需要 的 数据 而 处 理 器 正人 忙于 执行 程序 代码 时 ， 就 会 引起 证 突 。 

在 很 多 系统 中 ， 外 部 设备 和 存储 器 与 处 理 器 共享 相同 的 总 线 。 当 一 个 设备 〈 比 如 一 个 硬 
盘 驱 动 器 ) 需要 传输 数据 到 处 理 器 时 ， 我 们 可 以 想像 出 两 种 情景 。 





情景 #1 

1 磁盘 驱动 器 : “抱歉 打扰 ， 老 板 ， 我 有 512 个 字 节 给 你 。 

2 处 理 器 : “这 是 一 个 大 10-4 的 小 磁盘 伙伴 ， 给 我 第 一 个 字 节 。” 
3 磁盘 驱动 器 “好 ， 老 板 ， 给 你 。” 

4 处 理 器 : “我 收 到 了 ， 给 我 下 一 个 字 节 。” 

5 磁盘 驱动 器 : “给 你 。” 
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对 步骤 4 和 步骤 5 重复 进行 5310 次 。 

情景 #2 

1 磁 失 驱动 器 : “ 蜂 ， 老 板 ， 我 有 512 个 字 节 ， 它 们 要 在 我 的 磁盘 上 烧 一 个 洞 ， 我 要 支持 不 住 
了 ， 我 要 支持 不 住 了 。” (总 线 请 求 ) 

2 ”处 理 器 ， “好 ， 好 ， 请 住 嘴 ， 让 我 完成 这 个 指令 我 就 放 开 总 线 。 好 ， 我 做 完了 ， 总 线 
是 你 的 了 ， 别 浪费 时 间 ， 我 很 忙 。”( 总 线 授权 ) 

3 ”磁盘 驱动 器 “谢谢 老板 ， 你 是 好 伙伴 ， 我 感谢 你 ， 我 已 经 得 到 总 线 了 。” (总 线 确 认 ) 

4 ”磁盘 驱动 器 ; “我 将 把 数据 放 到 通常 的 地 点 。”( 自 言 自 语 ) 

5 磁盘 驱动 器 : “ 嘿 ， 老 板 ! 醒 醒 ， 我 要 离开 总 线 了 。” 

6 处理 器 : “谢谢 磁盘 ， 我 会 从 通常 的 地 点 找 回 数据 。” 

7 磁盘 驱动 器 : “通常 的 地 点 是 10-4， 我 走 了 。” 


从 这 两 个 情景 你 可 以 推断 出 ， 第 二 个 情景 的 效率 更 高 ， 因 为 外 部 设备 即 硬盘 能 从 处 理 器 
接管 对 存储 器 的 控制 ， 并 以 成 组 方式 写 所 有 的 数据 。 存 储 器 已 将 其 存储 器 接口 置 于 三 态 条 件 
中 ， 并 等 待 硬盘 驱动 器 的 信号 ， 表 明 其 能 归还 总 线 。 这 样 ，DMA 就 允许 在 处 理 器 空闲 时 ， 或 
者 从 独立 的 cache 存 储 器 进行 处 理 时 ， 其 他 设备 接管 总 线 并 实现 到 存储 器 的 数据 传输 或 从 存储 
器 过 来 的 数据 传输 。 而 且 ， 在 很 多 的 现代 处 理 器 有 很 大 的 片上 cache 的 情况 下 ， 将 外 部 总 线 移 
交 给 外 部 设备 对 于 处 理 器 来 说 几乎 没有 损失 任何 东西 。 让 我 们 记 住 关于 这 两 个 情景 的 幽默 讨 
论 ， 现 在 我 们 严肃 一 会 儿 。 图 6-28 显 示 出 简化 的 DMA 过 程 。 你 也 可 以 得 出 结论 说 我 不 应 该 放 
弃 我 白天 的 工作 而 成 为 一 个 系列 幽默 剧 的 作者 ， 但 那 是 其 他 时 间 要 讨论 的 了 。 


地 址 总 线 、 数 据 总 线 和 状态 总 线 
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图 6-28 DMA 传 输 的 示意 图 表示 


简单 地 说 ， 在 处 理 器 和 外 部 设备 之 间 发 生 的 是 握手 (handshake) 过 程 。 一 次 握手 就 是 一 
个 简单 的 动作 ， 它 期 望 一 个 回应 ， 表 明 该 动作 被 接受 。 该 过 程 可 描述 如 下 : 





。 外 部 设备 通过 向 处 理 器 输入 有 效 的 总 线 请 求 ( 8USREQ ) 信号 ,要求 从 处 理 器 得 到 对 总 线 
的 控制 。 

。 当 处 理 器 完成 当前 指令 周期 ， 且 没有 更 高 级 的 中 断 待 解决 时 ， 它 就 发 出 一 个 总 线 授 权 
( BUSGRA ) 信号 给 发 出 请 求 的 设备 ， 允 许 其 开始 自己 的 存储 器 周期 。 

*。 处 理 器 然后 就 处 于 空闲 或 者 继续 处 理 cache 内 部 的 数据 ， 直 到 BUSREQ 信 和 号 消失 。 


总 结 


*。 我们 介绍 了 在 一 个 计算 机 系统 内 部 进行 总 线 组 织 的 需要 ， 以 及 总 线 如 何 组 织 成 地 址 总 
线 、 数 据 总 线 和 状态 总 线 。 

* 继续 展开 上 一 章 的 讨论 ， 我 们 看 到 微 代码 状态 机 如 何 与 总 线 组 织 一 起 工作 来 控制 内 部 
总 线 上 的 数据 流 。 

。 我 们 看 到 三 态 缓冲 电路 如 何 使 独立 的 存储 单元 能 被 组 织 成 较 大 的 存储 器 阵列 。 

"我 们 引入 分 页 的 概念 ， 作 为 形成 存储 地 址 的 途径 和 建立 存储 系统 的 方法 。 

。 我 们 介绍 了 不 同类 型 的 现代 存储 技术 ， 以 理解 静态 RAM 技 术 和 动态 RAM 技 术 的 使 用 。 

* 最 后 ， 直 接 存储 器 访问 是 在 存储 器 和 外 设 之 间 移 动 大 块 数据 的 高 效 方式 。 
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习题 


1. 给 定 如 下 所 示 的 真 值 表 ， 设 计 一 个 2 输入 、4 输 出 的 存储 译 码 器 : 








2. 参见 图 6-11。 外 部 输入 和 输出 (IO) 信号 定义 如 下 : 
A0、Al1: 地 址 输入 ， 用 于 选择 对 哪 一 行 存储 器 单元 (D 触 发 器 ) 进行 读 出 和 写 入 。 
CS : 芯片 使 能 信号 。 当 其 变 低 时 ， 存 储 器 起 作用 ， 你 可 以 对 其 进行 读 出 和 写 入 。 
R/W : 读 / 写 线 。 在 高 电 平时 ， 阵 列 内 适当 的 一 行 就 被 某 外 部 设备 读 取 。 在 低 电 平时 ， 
某 外 部 设备 就 可 以 将 数据 写 到 适当 的 行 ， 这 个 适当 的 行 由 地 址 位 A0 和 Al 的 状态 定义 。 
DB0、DB1、DB2、DB3: 双向 数据 位 。 这 4 个 数据 位 定义 了 对 适当 行进 行 写 入 或 读 出 
的 数据 ， 该 适当 的 行 由 A0、A1 确 定 。 
这 个 阵列 工作 如 下 : 
A. 为 了 从 阵列 中 的 特定 地 址 〈 行 ) 读数 据 : 
a. 将 地 址 放 到 A0 和 Al 
b. 将 CS 置 为 低 
c. 将 R/W 置 为 高 
d. 数据 在 D0..D3 可 读 
B. 为 向 阵列 中 的 特定 地 址 写 数 据 : 
a. 将 地 址 放 到 A0 和 Al 
b. 将 CS 置 为 低 
c. 将 R/W 告 为 低 
d. 将 数据 放置 到 D0..D3 
D5 e. 将 R/ 页 置 为 高 
C. 每 个 单独 的 存储 器 单元 是 一 个 标准 的 DD 触发 器 ， 每 个 单独 的 存储 器 单元 上 还 有 一 个 
三 态 输出 缓冲 器 。 输 出 缓冲 器 由 每 个 触发 器 上 的 OE 信号 控制 。 当 这 个 信号 为 低 时 ， 输 出 就 
被 连接 到 数据 线 ， 存 储 在 触发 器 中 的 数据 就 可 读 。 当 这 个 信号 为 高 时 ， 触 发 器 的 输出 就 与 
数据 线 隔离 ， 使 得 数据 可 被 写 人 器 件 。 
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在 存储 器 阵列 图 中 请 看 标记 为 “存储 器 译 码 逻 辑 ” 的 方 框 。 为 该 电路 设计 真 值 表 ， 用 
天 -图 对 其 进行 化 简 ， 画 出 门 逻 辑 来 实现 这 个 设计 。 
3. 假设 你 有 一 个 处 理 器 ， 具 有 26 位 宽 地 址 总 线 和 32 位 宽 数 据 总 线 。 
a. 假如 你 正在 使 用 组 织 成 5312K 深 x 8 位 宽 (4M 位 ) 的 存储 器 芯片 。 需 要 多 少 存 储 器 心 
片 来 为 该 处 理 器 构建 存储 系统 ， 使 得 地 址 空间 完全 充满 ， 不 留 空 区 域 ? 
b. 假如 我 们 采用 512K 为 一 页 的 大 小 ， 对 于 前 三 页 完成 下 表 


页 号 起 始 地址 (Hex) 结束 地 址 (Hex) 


4. 考虑 图 6-23 中 的 存储 器 时 序 图 。 假 设 时 钟 频率 是 50MHz， 而 且 你 不 想 加 入 任何 等 待 状态 来 减 


慢 处 理 器 。 在 这 种 情况 下 对 于 该 处 理 器 来 说 能 正常 工作 的 最 慢 的 存储 器 访问 时 间 是 多 少 ? 

5. 用 几 句 话 定义 下 面 的 术语 : 

a) 直接 存储 器 访问 
b) 三 态 逻 辑 

6. 下 图 显示 的 是 一 个 存储 器 件 的 示意 图 ， 用 于 一 个 计算 

机 的 存储 器 系统 ， 其 设计 规范 定义 如 下 : 

。20 位 地 址 总 线 

。32 位 数据 总 线 

。 存储 器 在 页 0、 页 1 和 页 7 

a. 在 每 个 存储 器 件 中 有 多 少 可 寻 址 的 存储 位 置 ? 

b. 在 每 个 存储 器 件 中 有 多 少 个 存储 器 位 ? 

c. 在 计算 机 的 地 址 空间 中 ， 每 个 存储 器 件 所 徐 盖 的 十 六 进 制 地 址 范围 是 什么 ?你 可 以 
假设 存储 器 的 每 一 页 大 小 与 一 个 存储 器 件 的 地 址 范围 相等 。 

d. 在 这 个 存储 器 设计 中 ， 需 要 的 存储 器 件 总 数 是 多 少 ? 

e. 为 什么 基于 这 种 类 型 存储 器 件 的 存储 系统 设计 不 能 在 字 节 级 别 对 存储 位 置 进行 寻 
址 ? 用 一 两 句 话说 明 原 因 。 

7. 假 设 你 是 百 吉 城 灵魂 和 飞行 控制 系统 公司 (Soul of the City Bagel and Flight Control 
Systems Company) 的 首席 硬件 设计 师 。 你 的 工作 就 是 为 一 个 新 的 、 自 动 化 的 厨房 和 百 吉 饼 
制造 器 设计 一 个 计算 机 到 存储 器 的 子 系统 ， 这 是 为 正在 设计 中 的 下 一 代 商 业 客机 所 设计 的 。 
微 处 理 器 是 AB2000， 这 是 一 个 热门 的 新 芯片 ， 你 正 等 着 有 机 会 在 设计 中 使 用 它 。 

该 处 理 器 有 16 位 地 址 总 线 和 16 位 数据 总 线 ， 如 下 图 所 示 (为 简化 ， 对 于 这 个 习题 该 图 
只 显示 了 相关 的 处 理 器 信号 ) 。 图 中 还 显示 出 你 在 设计 中 要 使 用 的 ROM 和 SRAM 芯 片 的 示 
意图 和 引 脚 指定 。 
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存储 器 子 系统 有 三 个 状态 信号 ， 你 必须 使 用 它们 来 设计 存储 器 阵列 ， 

a. WR : 低 有 效 ， 它 指出 一 个 向 存储 器 写 的 周期 。 

b. RD : 低 有 效 ， 它 指出 一 个 从 存储 器 读 的 周期 。 

c. ADVAL : 低 有 效 ， 它 指示 地 址 在 总 线 上 稳定 ， 可 看 作 是 一 个 有 效 地址。 
存储 器 世 片 占据 下 面 的 存储 区 域 ， 

a. ROM 从 0x0000 直 到 0x3FFF 

b. SRAM 从 0xC000 直 到 0xFFFF 

c. 其 他 (不 需要 你 管 的 ) 从 0x4000 直 到 0xBFFF 

1) 设计 一 个 你 将 要 用 到 的 存储 器 译 码 电路 ， 它 必须 能 为 存储 器 芯片 各 自 的 地 址 范围 进行 正 
确 的 译 码 ， 也 能 对 处 理 器 的 WR、 RD 以 及 ADVA4L 进 行 译 码 来 产生 OE 、 CE 以 及 WR。 
提示 一 下 ， 参 考 课本 中 关于 存储 系统 的 部 分 就 可 得 到 OF 、CE 以 及 WR 的 方程 。 
假设 你 设计 的 电路 将 要 被 制作 进 一 个 存储 器 接口 芯片 U6 中 。 由 于 印刷 电路 设计 者 需要 

知道 所 有 部 件 的 引 脚 指定 ， 你 就 需要 为 图 中 U6 提供 引 脚 函数 的 规范 。 然 后 ， 你 就 对 这 些 引 

脚 指定 设计 存储 器 译 码 器 。 最 后 ， 为 简化 ， 你 决定 不 实现 字 节 可 寻 址 性 ， 所 有 的 存储 器 访 

问 都 将 是 字 宽 度 的 访问 。 

2) 为 你 的 设计 生成 一 个 网 表 。 一 个 示例 网 表 如 下 图 所 示 。 网 表 就 是 电路 互 连 或 “ 线 网 ”的 
表 。 一 个 线 网 就 是 在 电路 封装 上 的 所 有 要 连接 在 一 起 的 MO 引 脚 的 共同 连接 。 这 样 ， 在 
这 个 设计 中 ， 你 可 能 有 一 个 标记 为 “ADDR13” 的 线 网 ， 它 是 芯片 UI 上 的 引 脚 423 ( 简 
写 为 U1-23) 、U2-14、U3-14、U4-14、U5-14 的 共同 连接 。 网 表 由 印刷 电路 板 制造 商用 
来 实际 地 制造 PC 板 。 网 表 开 始 部 分 如 下 所 示 : . 
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线 网 名 称 

addr0 U1-36 U2-1 U3-1 U4-1 US-1 
addr1 U1-35 U2-2 U3-2 U4-2 U5-2 
addr2 U1-34 U2-3 U3-3 U4-3 US-3 
addr3 U1-33 U2-4 U3-4 U4-4 U5-4 
data0 U1-14 U2-15 U4-15 


8. 对 下 列 的 每 一 种 情况 完成 分 析 : 


a. 


b 


be 


全 


一 个 微 处 理 器 ， 有 20 位 的 地 址 范围 ,采用 8 个 存储 器 芯片 ， 每 个 芯片 的 容量 是 128K: 建 
立 一 个 表 ， 以 十 六 进 制 显示 出 每 个 存储 器 芯片 所 覆盖 的 地 址 范围 。 


. 一 个 微 处 理 器 ， 有 24 位 的 地 址 范围 ， 采 用 4 个 存储 器 芯片 ， 每 个 必 片 的 容量 是 64K: 两 个 


存储 器 蕊 片 占据 地 址 范围 的 前 128K， 两 个 芯片 占据 地 址 空间 顶端 的 128K。 建 立 一 个 表 ， 
以 十 六 进 制 显 示 出 每 个 存储 器 芯片 所 覆盖 的 地 址 范围 。 注 意 在 中 间 有 一 个 大 的 地 址 范围 ， 
其 中 有 没有 起 作用 的 存储 器 ， 这 是 相当 正常 的 情况 。 


.一 个 微 处 理 器 ， 有 32 位 的 地 址 范围 ， 采 用 8 个 存储 器 芯片 ， 每 个 芯片 的 容量 是 1M (1M= 


1 048 576) : 两 个 存储 器 芯片 占据 地 址 范围 的 前 2M，6 个 芯片 占据 地 址 空间 顶端 的 6M。 
建立 一 个 表 ， 以 十 六 进 制 显示 出 每 个 存储 器 芯片 所 覆盖 的 地 址 范围 。 


.一 个 微 处 理 器 ， 有 20 位 的 寻 址 范围 ， 采 用 8 个 不 同 大 小 的 存储 器 芯片 。4 个 存储 器 世 月 每 


个 有 128K 的 容量 ， 并 占据 着 从 00000 起 始 的 512K 连 续 地 址 。 其 他 4 个 存储 器 芯片 每 个 有 
32K 的 容量 ， 并 占据 着 寻 址 范围 最 顶端 的 128K。 建 立 一 个 表 ， 以 十 六 进 制 显 示 出 每 个 存 
储 器 芯片 所 覆盖 的 地 址 范围 。 


oo 








第 7 章 存储 器 组 织 和 汇编 语言 编程 


学 习 目 标 - 

"描述 一 个 典型 的 存储 系统 是 如 何 根据 存储 地 址 模式 进行 组 织 的 ， 
。 描述 计算 机 的 指令 集体 系 结构 与 其 汇编 语言 指令 集 的 关系 ; 

。 采 用 简单 的 寻 址 模式 写 一 个 简单 的 汇编 语言 程序 。 


> 
eb 
囊 


从 这 一 章 起 ， 我 们 将 从 硬件 设计 者 转 回 到 软件 工程 师 。 我 们 将 利用 迄今 所 学 到 的 关于 硬 
件 特性 的 知识 ， 考 察 它们 如 何 与 一 个 典型 微 处 理 器 的 指令 集体 系 结构 (ISA) 相 联 系 。 我 们 对 
体系 结构 的 学 习 将 从 一 个 软件 开发 者 的 观点 出 发 ， 其 中 软件 开发 者 需要 理解 体系 结构 以 便 将 
其 优势 发 挥 到 最 佳 。 在 这 种 意义 上 ， 我 们 学 习 汇 编 语言 其 实 是 从 另 一 种 途径 来 学 习 计 算 机 体 
系 结 构 。 这 个 观点 与 某 些 想 有 能 力 设 计 计算 机 硬件 的 人 的 观点 截然 不 同 。 本 书 关注 的 是 对 硬 
件 和 体系 结构 问题 的 理解 ， 使 得 我 们 的 软件 开发 能 最 大 限度 地 发 挥 硬件 设计 的 优势 。 

我 们 首先 考察 Motorola 68000 处 理 器 的 体系 结构 。68K 的 ISA 是 一 个 很 成 熟 的 体系 结构 ， 
产生 于 20 世 纪 80 年 代 早 期 。 你 很 显然 会 问 :“ 我 为 什么 要 学 这 样 古 老 的 计算 机 体系 结构 ? 它 难 
道 不 是 过 时 了 吗 ? ”回答 是 响亮 的 :“ 不 ! ”。68K 体 系 结构 一 直 是 最 流行 的 计算 机 体系 结构 
之 一 ，68K 的 衍生 技术 在 新 产品 设计 中 也 仍 有 应 用 , 掌上 PDA 还 在 使 用 由 68K 衍 生 的 体系 结构 。 
而 且 ，Motorola 的 一 款 全 新 的 处 理 器 ColdFire 系 列 就 采用 了 68K 体 系 结构 ， 目 前 ， 它 是 最 常 使 
用 的 处 理 器 之 一 。 例 如 ，ColdFire 用 在 很 多 喷 墨 打印 机 中 。 

在 接 下 来 的 章节 中 ， 我 们 还 将 看 到 另外 两 种 流行 的 体系 结构 ， 即 Intel x86 处 理 器 系列 和 
ARM 系 列 。 熟 悉 了 这 三 种 微 处 理 器 体系 结构 ， 我 们 就 熟识 了 当今 世界 上 最 流行 的 三 种 体系 结 
构 。 当 开始 我 们 的 探讨 时 ， 我 们 所 讨论 的 很 多 东西 对 这 三 种 体系 结构 来 说 都 是 共同 的 ， 所 以 当 
以 理解 基本 原理 为 目的 时 ， 学 习 某 一 种 体系 结构 与 学 习 其 他 种 体系 结构 相 比 ， 效 果 是 -一样 的 。 

从 68000 开 始 学 习 的 另 一 个 原因 是 该 体系 结构 对 学 习 过 程 有 帮助 。 它 的 存储 器 寻 址 模式 简 
单 易 懂 ， 从 软件 开发 者 的 角度 来 看 ， 与 高 级 语言 相 联 系 更 易 理解 。 

我 们 将 再 次 考察 存储 器 模型 ， 并 将 此 作为 起 点 来 学 习 计算 机 如 何 实际 地 对 存储 器 进行 读 
和 写 。 从 硬件 角度 ， 我 们 已 经 知道 这 些 原理 ， 因 为 我 们 刚刚 完成 对 它 的 学 习 。 但 是 ， 我 们 现 
在 要 从 ISA 的 角度 来 看 待 这 个 问题 。 在 这 个 学 习 过 程 中 ， 我 们 将 会 看 到 为 什么 这 个 看 起 来 有 些 
奇怪 的 看 待 存储 器 的 方式 ， 实 际 上 从 高 级 语言 如 C 和 C++ 的 角度 来 看 却 是 非常 重要 的 。 女 士 们 
和 先生 们 ， 让 我 们 开始 吧 …… 
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当 你 开始 从 体系 结构 级 别 来 审视 一 个 计算 机 时 ， 你 很 快 就 会 意识 到 ， 处 理 器 和 存储 器 的 
关系 是 定义 机 器 的 行为 和 操作 特性 的 关键 因素 之 一 。 实 际 上 ， 关 于 计算 机 如 何 围绕 它 到 存储 
器 的 接口 循环 反复 以 完成 其 编程 任务 已 经 有 很 多 事例 了 。 当 我 们 开始 用 汇编 语言 编程 时 ， 你 
很 快 就 会 看 到 ， 计 算 机 所 做 的 大 多 数 工 作 都 涉及 将 数据 移 进 和 移出 存储 器 。 事 实 上 ， 无 论 原 
始 程序 是 用 C++ 编写 的 ， 还 是 用 汇编 语言 编写 的 ， 如 果 制 作 一 个 在 程序 中 使 用 的 汇编 语言 指 
令 数 的 条 形 图 ， 你 将 会 发 现 使 用 的 大 多 数 指令 是 移动 指令 。 因 此 ， 我 们 最 先 要 做 的 事情 之 一 
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就 是 理解 存储 系统 是 如 何 组 织 的 ， 并 且 从 处 理 器 的 角度 来 看 存储 系统 。 

图 7-1 就 是 68K 处 理 器 的 一 个 相当 典型 的 存储 器 布局 图 。 处 理 器 可 对 16 777 216 (16M) 字 
节 的 存储 器 进行 寻 址 ， 它 有 23 条 外 部 的 字 地 址 线 和 2- 字 节 的 选择 控制 信号 (用 于 在 存储 于 字 
位 置 的 两 个 字 节 中 选择 其 一 )。 外 部 数据 总 线 是 16 位 宽 的 , 但 所 有 内 部 数据 通路 都 是 32 位 宽 的 。 
从 68020 开 始 的 68K 系 列 的 后 续 成 员 都 有 32 位 的 外 部 数据 总 线 。 在 图 7-1 中 ， 我 们 看 到 存储 器 的 





0x000000 
OxO1FFFE 
IO 设备 
IO 设备 
0xF00000 
OxFFFFFE 


范围 的 原因 。 较 上 面 的 地 址 范围 通常 包含 KAM 存储器， 这 是 易 失 性 的 读 / 写 存储 器 ， 存 储 的 是 
/ 程序 代码 和 初始 化 向 量 | 
64K x 16 
图 7-1 一 个 基于 68K 的 计算 机 系统 的 存储 器 布局 图 
位 宽 的 存储 器 ， 现 今 正在 使 用 的 很 多 计算 机 也 有 16 位 宽 的 数据 通路 。 作 为 一 个 极端 的 例子 ， 
偏 移 是 页 中 的 4 种 可 能 的 字 节 位 置 。 然 而 ， 字 节 寻 址 和 真实 的 分 页 之 间 有 一 个 很 大 的 不 同 ， 对 


前 128K 的 字 (16 位 ) 占据 了 从 0x000000 到 0x01FFFE 的 地 址 范围 ， 这 些 字 一 般 是 程序 代码 和 向 
量 表 ， 向 量 表 占 据 了 存储 器 的 前 256 个 长 字 ， 这 就 是 为 什么 非 易 失 性 只 读 存 储 器 占据 较 低 地 址 
变量 。 其 余 的 存储 空间 包含 了 LO 设备 的 地 址 。 图 7-1 中 所 有 剩 下 的 存储 空间 都 是 空 的。 而 且 ， 
我 们 很 快 将 会 看 到 ， 为 什么 ROM 和 RAM 的 最 后 一 个 字 的 地 址 分 别 是 0x01FFFE 和 0xFFFFFE。 
堆栈 和 堆 ， 变 量 存储 

由 于 8 位 〈 即 一 个 字 节 ) 是 我 们 通常 要 处 理 的 最 小 数据 量 ， 所 以 当 我 们 要 打交道 的 存储 器 
也 是 8 位 宽 时 ， 在 存储 器 中 存储 字 节 大 小 的 字符 (char) 就 会 很 方便 。 然 而 ， 我 们 的 PC 都 有 32 
我 们 不 想 仅仅 因为 我 们 想 将 一 个 8 位 的 量 存 到 一 个 32 位 存储 器 中 就 浪费 24 位 的 存储 空间 ， 所 以 
计算 机 就 设计 成 允许 按 字 节 寻 址 。 可 以 将 字 节 寻 址 看 作 是 分 页 的 一 个 例子 ， 页 地 址 是 32 位 字 ， 
于 字 节 寻 址 ， 我 们 没有 一 个 对 应 于 页 地 址 的 单独 的 字 地 址 。 图 7-2 显 示 出 了 这 个 重要 的 不 同 点 。 

长 字 地 址 





000000 字 节 0 一 地 址 000000 | 字 节 1 一 地 址 9000001 上 字 节 2 一 地 址 000002 字 节 3 一 地 址 000003 
000004 字 节 0 一 地 址 000004 | 字 节 1 一 地 址 000005 | 字 节 2 一 地 址 000006 字 节 3 一 地 址 000007 
000008 字 节 0 一 地 址 000008 | 字 秆 1 一 地 址 000009 | 字 节 2 一 地 址 00000A 字 节 3 一 地 址 00000B 
00000C 字 节 0 一 地 址 00000C 上 字 节 1 一 地 址 00000D | 字 节 2 一 地 址 00000E 字 节 3 一 地 址 00000F 
000010 字 节 0 一 地 址 900010 | 字 节 1 一 地 址 9000011 | 字 节 2 一 地 址 0900012 字 节 3 一 地 址 000013 
































FFFFFO 字 节 0 一 地 址 FFFFF0 | 字 节 1 一 地 址 FFFFF1 | 字 节 2 一 地 址 FFFFF2 字 节 3 一 地 址 FFFFF3 
FFFFF4 字 节 0 一 地 址 FFFFF4 | 字 节 1 一 地 址 FFFFF5 | 字 节 2 一 地 址 FFFFF6 字 节 3 一 地 址 FFFFF7 
FFFFF8 字 节 0 一 地 址 FFFFF8 | 字 节 1 一 地 址 FFFFF9 | 字 节 2 一 地 址 FFFFFA 字 节 3 一 地 址 FFFFFB 
FFFFFC ”| 字 节 0 一 地 址 FFFFFC | 字 节 1 一 地 址 FFFFFD | 字 节 2 一 地 址 FFFFFE 字 节 3 一 地 址 FFFFFF 





图 7-2 在 一 个 32 位 宽 的 字 中 ， 字 寻 址 和 字 节 寻 址 的 关系 
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我 们 称 这 种 类 型 的 存储 器 存储 为 字 节 包装 (byte packing)， 因 为 我 们 实际 上 是 将 充满 字 节 
的 32 位 存储 器 包装 起 来 。 这 种 类 型 的 寻 址 引起 了 若干 的 含糊 性 ， 有 一 个 相当 严重 ， 其 他 的 则 
对 我 们 来 说 纯粹 是 新 的 。 我 们 立刻 讨论 这 个 严重 的 问题 ， 参 见 图 7-2， 我 们 看 到 在 存储 器 地 址 
FFFFF0 (字符 ) 的 字 节 和 在 FFFFF0 的 32 位 长 字 (整数 ) 有 相同 的 地 址 。 这 个 灾难 会 发 生 吗 ? 
答案 是 绝对 “可 能 ”。 例 如 在 C 和 C++ 中 ， 在 使 用 一 个 变量 之 前 ， 你 必须 声明 该 变量 及 其 类 型 ， 
现在 你 明白 其 中 的 原因 了 吧 。 除 非 编译 器 知道 存储 于 地 址 FFFFF0 的 变量 的 类 型 ， 否 则 它 不 知 
道 必 须 生成 什么 类 型 的 代码 来 对 其 操作 。 而 且 ， 如 果 你 想 在 FFFFF0 存 储 一 个 字符 ， 则 编译 器 
必须 知道 为 其 分 配 多 少 存储 空间 。 

此 外 ， 还 要 注意 的 是 ， 在 不 能 被 4 整除 的 地 址 上 ， 我 们 不 能 访问 32 位 字 。 一 些 处 理 器 允许 
我 们 在 奇数 边界 存储 32 位 值 ， 比 如 字 节 地 址 000003 一 000006， 但 其 他 很 多 的 处 理 器 都 不 允许 。 
其 中 的 原因 是 处 理 器 将 不 得 不 做 若干 次 附加 的 存储 器 操作 来 读 取 全 部 的 值 ， 然 后 再 做 一 些 额 
外 的 工作 来 以 正确 的 次 序 重建 这 些 字 节 ， 我 们 称 此 为 非 对 齐 访 问 (nonaligned access)， 若 允 
许 其 发 生 ， 则 通常 在 处 理 器 性 能 方面 的 成 本 相当 高 。 事 实 上， 如果 你 考察 存储 器 映像， 了 解 
编译 器 在 存储 器 中 是 如 何 存储 对 象 和 结构 的 ， 那 么 你 就 会 常常 看 到 数据 中 的 空闲 区 ， 它 们 所 
对 应 的 是 有 意 留 出 的 间隙 ， 是 为 了 不 产生 包含 非 对 齐 访 问 的 数据 区 域 。 

还 要 注意 ， 当 我 们 进行 32 位 字 的 访问 时 ， 地 址 位 A0 和 Al1 没 有 被 使 用 。 这 不 禁 使 你 要 问 : 
“我 没有 使 用 它们 ， 它 们 有 什么 用 呢 ? ”然而 ， 当 需要 访问 一 个 32 位 字 内 的 特定 字 节 时 ， 我 们 
确实 需要 它们 。A0 和 Al 经 常 被 叫做 字 节 选择 线 (byte selector) ， 因 为 这 是 它们 的 主要 功能 。 
另 一 点 是 当 我 们 在 向 存储 器 写 的 时 候 ， 我 们 确实 需要 字 节 选择 线 。 从 存储 器 读 还 算 无 害 ， 但 
写 会 改变 所 有 东西 。 因 此 ， 你 就 想 确保 你 只 改变 了 感 兴趣 的 字 节 而 不 是 其 他 字 节 。 从 一 个 硬 
件 设计 者 的 角度 ， 有 字 节 选择 线 就 使 你 能 限定 写 操作 只 针对 你 感 兴趣 的 字 节 。 

很 多 处 理 器 根本 没有 明确 的 字 节 选择 线 ， 而 是 在 状态 总 线 上 提供 信号 用 来 限定 对 存储 器 
的 写 操作 。 将 16 位 数 (一 种 短 数据 类 型 ) 存储 到 32 位 存储 器 位 置 会 怎样 呢 ? 相同 规则 也 同样 
适用 于 这 种 情况 。 有 效 的 地 址 只 是 那些 能 被 2 整除 的 地 址 ， 如 000000、000002、000004， 等 等 。 
在 16 位 字 寻 址 的 情况 下 ， 不 需要 最 低地 址 位 A0。 对 于 68K 处 理 器 ， 有 到 存储 器 的 16 位 宽 数据 
总 线 ， 我 们 能 在 存储 器 的 每 个 字 中 存储 两 个 字 节 ， 所 以 A0 没 被 用 于 字 寻 址 ， 而 是 成 了 处 理 器 

图 7-3 显 示 出 一 个 典型 的 32 位 处 理 器 及 其 存储 系统 接口 。 为 清楚 起 见 ， 来 自 处 理 器 的 读 信 
号 和 片 选 信 号 被 省 用 了。 处 理 器 有 32 位 数据 总 线 和 32 位 地 址 总 线 。 存 储 器 芯片 代表 了 处 理 器 
地 址 空间 某 处 的 一 页 RAM， 确 切 的 存储 页 号 由 地 址 译 码 逻 辑 块 的 设计 所 决定 。 每 个 RAM 艾 片 
有 1M 位 的 容量 ， 组 织 成 128K x 8 的 形式 。 

由 于 我 们 有 32 位 宽 数据 总 线 ， 而 每 个 RAM 芯 片 有 8 条 数据 MO 线 ， 所 以 对 于 每 个 128K 宽 的 
页 就 需要 4 个 存储 器 芯片 。 芯 片 纪 连接 到 数据 线 D0 至 D7， 芯 片 2 连接 到 数据 线 D8 至 D15， 世 
3 连接 到 数据 线 D16 至 D23， 芯 片 4 连 接 到 数据 线 D24 至 D31。 

来 自 处 理 器 的 地 址 总 线 包 含 30 条 地 址 线 ， 这 意味 着 可 寻 址 230 长 的 字 (32 位 宽 )。 寻 址 全 部 
2 字 节 空间 所 需要 的 另外 的 地 址 位 隐 含 地 由 处 理 器 控制 ， 显 式 的 则 由 4 个 写 使 能 信号 来 控制 ， 
标记 为 WE0 至 WE3 。 

来 自 处 理 器 的 地 址 线 A2 到 Al18 连 接 到 RAM 芯 片 的 地 址 输入 A0 到 Al16， 来 自 处 理 器 的 A2 连 
接 到 4 个 茸 片 中 的 每 个 芯片 的 A0， 依 此 类 推 。 这 开始 看 起 来 有 点 古怪 ， 但 你 仔细 考虑 后 就 会 明 
白 了 。 事 实 上 ， 没 有 特殊 的 理由 要 求 来 自 处 理 器 的 每 个 地 址 必须 连接 到 每 个 存储 器 件 的 相同 
地 址 输入 引 脚 。 例 如 ， 来 自 处 理 器 的 A2 可 连接 到 芯片 共 1 的 A14、 蕊 片 共 2 的 A3 和 芯片 林 3 的 
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A16。 来 自 处 理 器 的 相同 地 址 显然 在 寻 址 4 个 存储 器 芯片 的 不 同 字 节 位 置 ， 但 只 要 来 自 处 理 器 
的 17 条 地 址 线 连 接 到 存储 器 件 的 17 条 地 址 线 ， 存 储 器 就 应 该 能 正确 地 工作 ，。 
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图 7-3 一 个 32 位 微 处 理 器 的 存储 器 组 织 。 为 清楚 起 见 ， 将 片 选 信号 和 读 信号 省 略 了 


来 自 处 理 器 的 高 地 址 位 A19 到 A31 用 于 页 选择 过 程 ， 这 些 信号 被 发 送 到 地 址 译 码 逻辑 来 生 
成 适当 的 CHIP 5ELECT 信号 。 在 图 7-3 中 略 去 了 这 些 信号 。 在 本 例 中 有 13 个 高 地 址 位 ， 这 些 
地 址 位 给 出 了 2" 即 8 192 页 的 存储 空间 ， 每 一 页 占据 128K 的 32 位 宽 的 字 ， 合 计 23 个 长 字 。 根 
据 地 址 计算 ， 每 一 页 实际 包含 512KB， 所 以 每 一 页 的 字 节 地 址 范围 就 是 从 字 节 地 址 (用 十 六 
进 制 表示 ) 00000 直 到 7FFFF。 记 住 在 这 个 存储 方案 中 有 8 192 页 ， 每 页 占据 512KB， 这 样 ， 页 
地 址 就 是 从 0000 到 1FFF。 对 你 来 说 ， 页 地 址 和 偏 移 地 址 的 相互 关系 可 能 看 起 来 不 那么 明显 ， 
但 是 如 果 你 将 十 六 进 制 地 址 扩展 成 二 进 制 ， 并 将 其 依次 排列 ， 你 就 会 看 到 全 部 的 32 位 地 址 。 

现在 ， 让 我 们 看 看 处 理 器 如 何 处 理 小 于 长 字 的 数据 。 假 设 处 理 器 要 从 地 址 ABCDEF64 中 读 
一 个 长 字 ， 而 这 个 地 址 被 译 码 到 图 7-3 的 页 上 。 这 个 地 址 在 32 位 边界 上 ，A0 和 Al 都 等 于 0 且 未 
用 作 进 入 存储 器 的 外 部 地 址 的 一 部 分 。 然 而 ， 如 果 处 理 器 想 对 位 于 地 址 ABCDEF64 或 地 址 
ABCDEF66 的 两 个 字 之 一 做 一 次 字 访 问 ， 那 么 它 仍 将 生成 同样 的 外 部 地 址 。 当 数据 被 读 进 处 理 
器 时 ， 长 字 中 不 需要 的 那 1/2 就 会 被 抛弃 掉 。 由 于 这 是 一 个 读 操 作 ， 存 储 器 的 内 容 不 会 受 影响 。 

如 果 处 理 器 想 读 位 于 地 址 ABCDEF64、ABCDEF65、ABCDEF66 或 ABCDEF67 中 的 4 个 字 
节 中 的 任何 一 个 ， 那 么 它 仍然 会 像 以 前 一 样 执行 相同 的 读 操 作 ， 这 时 它 还 是 只 保留 感 兴趣 的 
字 节 而 抛弃 其 他 字 节 。 

现在 ， 让 我 们 考虑 一 个 写 操作 。 在 这 种 情况 下 ， 我 们 关心 的 是 可 能 破坏 存储 器 的 内 容 ， 
所 以 当 我 们 向 存储 器 写 一 个 小 于 一 个 长 字 的 量 时 ， 我 们 想 确保 不 会 意外 地 写 入 更 多 的 量 。 我 
们 假设 只 想 在 存储 器 位 置 ABCDEF65 写 一 个 新 值 ， 在 这 种 情况 下 ， 信 号 FEI 就 必须 有 效 ， 所 
以 只 修改 那个 字 节 地 址 1 位 置 的 数据 。 这 样 ， 要 向 存储 器 写 一 个 字 节 ， 我 们 只 要 使 4 个 写 使 能 
信号 之 一 有 效 即 可 。 要 向 存储 器 写 一 个 字 ， 我 们 就 要 使 WE06 和 WEI 一 起 有 效 ， 或 者 WED 
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和 WE3 一 起 有 效 。 最 后 ， 要 写 一 个 长 字 ， 所 有 4 个 写 使 能 线 均 应 有 效 。 

将 32 位 字 存 到 16 位 存储 器 的 情况 又 怎么 样 呢 ?在 这 种 情况 下 ，32 位 字 可 被 存 到 任意 偶数 
字 边 界 上 ， 因 为 处 理 器 必须 总 是 进行 两 次 连续 的 存储 器 访问 才能 得 到 全 部 32 位 的 量 。 然 而 ， 
多 数 的 编译 器 还 是 试图 将 32 位 字 存 到 自然 边界 上 (可 被 4 整除 的 地 址 )。 这 就 是 为 什么 汇编 语 
言 程序 员 常 常 能 节省 一 点 空间 或 能 加 速算 法 的 原因 ， 汇 编 语言 程序 员 无 视 编译 器 生成 代码 的 
方法 ， 而 是 对 其 进行 调整 以 获得 更 高 的 效率 。 

让 我 们 再 回 到 原来 的 话题 。 对 于 一 个 32 位 处 理 器 ， 地 址 位 A2...A31 用 于 寻 址 1 073 741 824 
个 可 能 的 长 字 ， 而 A0...A1 用 于 在 长 字 内 寻 址 4 个 可 能 的 字 节 ， 这 就 在 32 位 处 理 器 中 给 予 我 们 
总 共 4 294 967 296 个 可 寻 址 的 字 节 位 置 。 换 句 话 说， 我们 有 4GB 的 字 节 寻 址 空间 。 对 于 一 个 
像 68K 这 样 有 16 位 寓 数 据 总 线 的 处 理 器 ， 地 址 线 Al1-A23 用 于 字 寻 址 ， 而 A0 用 于 字 节 选择 。 

结合 以 上 所 有 这 些 ， 你 就 会 看 到 问题 所 在 。 你 可 能 在 相同 的 地 址 上 有 8 位 的 字 节 、16 位 的 
字 或 32 位 的 长 字 ， 这 样 不 会 造成 含义 模糊 吗 ? 确实 会 。 当 用 高 级 语言 编程 时 ， 我 们 依靠 编译 
器 来 保存 这 些 杂乱 的 细节 ， 这 就 是 为 什么 将 一 种 变量 类 型 强制 转换 (casting) 成 另 一 种 类 型 
会 如 此 地 危险 。 当 我 们 用 低级 语言 编程 时 ， 我 们 就 依赖 于 程序 员 的 技巧 来 保存 这 些 细节 。 

看 起 来 很 容易 ， 但 事实 并 非 如 此 。 这 个 计算 机 生活 中 的 小 小 事实 就 是 软件 故障 的 主要 原 

因 。 一 个 简单 的 概念 怎么 会 如 此 复杂 呢 ? 这 不 是 复杂 ， 而 只 是 含糊 。 图 7-4 阐 明了 这 个 问题 。 

图 7-4 中 最 左 一 列 显示 了 一 个 字符 串 (适当 地 命名 为 “string”)， 存 储 于 8 位 存储 器 空间 中 。 每 
个 ASCII 字 符 占据 连续 的 存储 位 置 。 





们 
7 0 
[TI Ox0000 Ox00001 rr rr Ox00000 oxo00000 Bir Dx000001 
[ | 
一 个 8 位 处 理 器 一 个 16 位 处 理 -一 一 个 16 位 处 理 
的 字 节 可 寻 址 存 器 的 字 节 可 寻 一 器 的 字 节 可 寻 
储 器 ， 带 有 16 位 址 存储 器 ， 带 | 址 存储 器 ， 带 
| 寻 址 范围 有 20 位 寻 址 范 “| 有 24 位 寻 址 范 
围 Intel180186 一 1 围 MC68000 
低 端 字 节 序 |—| 高 端 字 节 序 
一 一 


OxFFFE 
OxFFFF OxFFFFF 





OxFFFFE QOxFFFFFE 局 二 OxFFFFFF 


图 7-4 将 字 节 组 装 成 16 位 存储 器 字 的 两 种 方法 。 将 低 序 字 节 放 到 字 的 低 序 
端 称 为 低 端 字 节 序 。 将 低 序 字 节 放 到 字 的 高 序 端 称 为 高 端 字 节 序 


中 间 一 列 显 示 了 一 个 16 位 存储 器 ， 其 组 织 方式 使 得 连续 的 字 节 从 右 向 左 存储 ， 对 应 于 
A0=0 的 字 节 与 16 位 字 的 低 序 部 分 DB0...DB7 对 齐 ， 对 应 于 A0=1 的 字 节 与 16 位 字 的 高 序 部 分 
DB8..….DB15 对 齐 ， 这 称 为 低 端 字 节 序 (Little Endian) 组 织 。 最 右 一 列 以 从 左 到 右 的 方式 将 这 
些 字 符 存储 成 了 连续 的 字 节 ， 对 应 于 A0=0 的 字 节 位 置 与 16 位 字 的 高 序 部 分 对 齐 ， 这 称 为 高 端 
字 节 序 (Big Endian) 组 织 。 作 为 一 个 习题 ， 请 看 图 7-2 中 字 节 是 如 何 存储 的 ， 它 们 是 高 端 字 
节 序 还 是 低 端 字 节 序 ? 

Motorola 和 Intel 选 择 使 用 了 不 同 的 字 节 序 规约 ， 为 编程 世界 打开 了 潘多拉 的 盒子 。 这 样 ， 
为 一 种 规约 所 写 的 C 或 C++ 代码 当 被 转向 另 一 种 规约 时 ， 就 会 有 微妙 的 错误 。 还 有 更 坏 的 情况 。 
当 设 计 意图 所 使 用 的 规约 被 假设 成 另外 一 种 规约 时 ， 相 互 进 行 项 目 合作 的 工程 师 们 就 会 曲解 
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设计 规范 。ARM 体 系 结构 允许 程序 员 在 上 电 启动 时 就 确立 处 理 器 采用 哪 种 字 节 序 ， 因此， 虽 
然 ARM 处 理 器 既 能 处 理 高 端 字 节 序 也 能 处 理 低 端 字 节 序 ， 但 一 旦 字 节 序 确立 ， 它 就 不 能 动态 
地 切换 字 节 序 模式 。 图 7-5 针 对 一 个 用 4 个 字 节 打包 的 32 位 字 显示 了 两 种 规约 的 不 同 。 


31 2423 1615 87 0 31 2423 1615 87 0 


AO 1 0 1 0 A0 0 1 0 1 
A1 1 1 0 0 A1 0 0 1 1 


低 端 字 节 序 高 端 字 节 序 
图 7-5 以 低 端 字 节 序 和 高 端 字 节 序 对 32 位 字 进 行 字 节 打 包 


如 果 你 想 从 本 课本 学 到 一 些 东 西 ， 就 可 以 考虑 这 个 问题 ， 因 为 在 你 作为 软件 开发 者 的 生 
涯 中 ， 你 至 少 会 遇 到 一 次 这 个 问题 。 

在 你 指责 我 死 揪 住 这 个 题目 不 放 之 前 ， 让 我 们 再 从 硬件 的 角度 考虑 一 下 这 个 问题 。 整 个 
存储 器 寻 址 区 域 对 于 新 手 程序 员 和 经 验 丰 富 的 老手 都 是 容易 搞 糊 涂 的 ， 而 且 ， 还 存在 体系 结 
构 和 制造 商 的 技术 所 引入 的 含糊 性 ， 所 以 ,现在 让 我 们 看 一 下 对 68K Motorola 是 如 何 处 理 这 
个 问题 的 ， 也 许 这 会 帮助 我 们 更 好 地 理解 真实 情况 ， 至 少 是 对 于 Motorola 处 理 器 的 情况 ， 虽 
然 我 们 以 前 在 图 7-3 中 已 经 接触 过 这 个 问题 。 图 7-6 总 结 了 68K 处 理 器 的 存储 器 寻 址 方案 。 





高 数据 选 通 (vps) 


图 7-6 Motorola 68K 处 理 器 的 存储 器 寻 址 模式 


68K 处 理 器 能 直接 寻 址 16MB 的 存储 器 ， 需 要 24 条 “有 效 的 ”地 址 线 ， 为 什么 ? 是 因为 224 
=16 777 216。 在 图 7-6 中 我 们 看 到 23 条 地 址 线 ， 那 条 失踪 了 的 线 A0 是 由 另外 两 个 控制 信 
号 LDS 和 UDS 综 合 出 来 的 。 x 

对 于 一 个 16 位 宽 的 外 部 数据 总 线 ， 我 们 通常 将 A0 作 为 字 节 选择 线 。 当 A0 为 0 时 我 们 就 选 
择 了 偶数 字 节 ， 而 A0 为 1 时 我 们 就 选择 了 奇数 字 节 。68K 的 字 节 序 (endianness) 是 高 端 字 节 
序 ， 所 以 偶数 字 节 与 数据 总 线 的 D8 到 D15 是 对 齐 的 。 参 见 图 7-6， 我 们 看 到 从 处 理 器 实际 发 出 
了 两 个 总 线 信 号 ， 分 别 为 0D5 (Upper Data Strobe) 和 D5 (Lower Data Strobe ) 。 
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当 处 理 器 在 对 存储 器 做 一 个 字 节 的 访问 时 ， 或 者 LDS 有 效 或 者 UDS 有 效 ， 向 存储 器 指明 
正在 访问 字 的 哪个 部 分 。 如 果 在 偶数 地 址 的 字 节 正在 被 访问 (A0=0)， 则 UDS 有 效 而 LDS 保 
持 为 高 ， 即 关闭 状态 。 如 果 奇 数字 节 正 在 被 访问 (A0= 1) ， 则 LDS 有效 而 UDS 保 持 为 高 。 对 
于 一 个 字 访 问 ，UDS 和 LDS 都 有 效 。 这 种 行为 在 图 7-6 中 的 表 中 进行 了 总 结 。 

你 也 许 通常 会 将 LDS 和 UDS 用 作 到 存储 器 控制 系统 的 门 控 信和 号。 例如， 你 可 能 会 采用 图 7-7 
显示 的 电路 来 控制 向 哪个 字 节 和 写 。 

你 可 能 会 为 这 个 电路 而 抓 耳 找 腮 。 为 什么 要 使 用 或 。 wR 一 
门 ? 我 们 可 以 通过 两 种 途径 来 回答 这 个 问题 。 首 先 , 由 LDS 
于 所 有 信号 都 是 低 有 效 的 ， 所 以 我 们 实际 上 所 处 理 的 是 


WE1 





与 函数 的 负 逻 辑 等 价 的 国 数 。 与 门 的 负 逻 辑 等 价 的 函数 ) on) ves 
就 是 或 函数 ， 因 为 输出 为 0 当 且 仅 当 两 个 输入 均 为 0。 UDS 
第 二 种 途径 是 通过 德 摩根 定理 的 等 价 方程 。 回 忆 
一 下 ; 图 7-7 控制 68K 处 理 器 字 节 写 的 简单 电路 
(A*B)=A+B (1) 
(A+B)= A*B (2) 


这 样 ， 方 程 1 显示 出 A 和 5 的 或 就 等 价 于 使 用 正 逻 辑 信 号 4 和 B 的 与 非 。 
现在 ,假设 你 试图 在 奇数 地 址 做 一 次 字 访 问 。 例 如 ， 假 设 你 写 出 了 下 面 的 汇编 语言 指令 : 
move.w DO, $1001 * 这 是 一 个 非 对 齐 访问 ! 

这 条 指令 告诉 处 理 器 对 存 于 内 部 寄存 器 D0 中 的 字 做 一 个 拷贝 ， 并 将 该 字 的 拷贝 存 入 到 外 
部 存储 器 中 地 址 $1001 开 始 的 地 方 。 因 为 字 节 序 要 求 访问 两 个 存储 器 位 置 才能 正确 地 安置 这 些 
字 节 ， 所 以 处 理 器 需要 执行 两 个 存储 器 周期 来 完成 访问 。 一 些 处 理 器 有 能 力 做 这 种 类 型 的 访 
问 ， 但 是 68K 是 没有 这 种 能 力 的 处 理 器 之 一 。 如 果 发 生 了 非 对 齐 访问 ， 处 理 器 将 产生 异常 并 自 
动 转移 到 某 种 用 户 定义 的 代码 (但 愿 编程 者 已 考虑 到 这 种 情况 ) 来 试图 处 理 错误 ， 或 者 至 少 
优雅 地 中 止 。 

由 于 68K 处 理 器 内 部 是 32 位 宽 的 ， 只 是 有 一 个 到 外 部 存储 器 的 16 位 宽 数 据 总 线 ， 我 们 就 需要 
知道 它 是 如 何 也 在 外 部 存储 器 中 存储 32 位 量 的 。 图 7-8 为 我 们 展示 了 在 存储 器 中 存储 长 字 的 规约 。 

虽然 图 7-8 可 能 看 起 来 使 人 迷惑 ， 但 它 


只 是 以 某 种 更 简略 的 方式 重申 了 图 7-2 的 内 偶数 字 节 奇数 字 节 
容 。 该 图 告诉 我 们 ， 被 称 为 长 字 (long 或 76 54210|7 ss5s4as210 
long word) 的 32 位 数据 量 在 存储 器 中 的 存 1 个 长 字 = 32 位 


储 方式 是 : 最 高 有 效 的 16 位 (D16-D31) 15 14 18122110 9876543210 
存 于 第 一 个 字 地 址 位 置 ， 而 最 低 有 效 的 16 
位 (D0 一 D15) 存 于 下 一 个 最 高 的 字 位 置 。 
而 且 ， 偶 数字 节 地 址 与 16 位 字 地 址 的 高 序 
是 部 分 对 齐 的 (高 端 字 节 序 )。 


汇编 语言 介绍 


PC 世界 是 由 一 个 指令 集体 系 结构 
(ISA) 所 支配 的 ， 这 个 ISA 是 Intel 在 25 年 前 
首先 定义 的 ， 称 为 x86， 这 是 因为 这 个 家 族 图 7-8 Motorola 68000 处 理 器 的 存储 器 存储 规约 
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的 成 员 有 如 下 的 血统 关系 : 
8080 一 8086 一 80186 一 80286 一 80386 一 80486 一 奔腾 


嵌入 式微 处 理 器 的 世界 (就 是 在 如 手机 这 样 的 设备 内 部 的 单 用 途 的 微 处 理 器 ) 由 
Motorola 680x0 ISA 所 支配 : 


68000 一 68010 一 68020 一 68030 一 68040 一 68060 一 ColdFire 


CodeFire 将 一 种 称 为 RISC 的 现代 处 理 器 体系 结构 以 向 后 兼容 的 方式 与 原始 68K ISA 联 合 起 
来 。( 我 们 将 在 后 面 课 程 中 学 习 这 些 体系 结构 。) 向 后 兼容 非常 重要 ， 因 为 还 有 如 此 多 的 68K 
代码 广泛 存在 并 被 使 用 着 。Motorola 68K 指 令 集 是 最 多 被 学 习 的 ISA 之 一 ， 如 果 你 用 “68K” 
或 “68000” 做 一 个 Web 搜 索 ， 你 会 发 现 符合 的 数量 之 多 令 人 难以 置信 。 

每 个 计算 机 都 有 一 个 其 所 能 执行 的 基本 操作 的 集合 ， 这 些 操作 由 处 理 器 的 指令 集 
(instruction set) 来 定义 。 一 个 特定 的 指令 集 的 存在 是 由 计算 机 的 内 部 组 织 和 操作 设计 的 方式 
所 决定 的 ， 这 就 是 我 们 所 称 的 计算 机 体系 结构 。 体 系 结构 从 其 所 能 执行 的 汇编 语言 指令 反映 
出 来 ， 因 为 这 些 指 令 就 是 我 们 访问 计算 机 资源 的 机 制 。 指 令 集 是 处 理 器 的 原子 要 素 ， 所 有 复 
杂 操 作 都 是 通过 构建 这 些 基 本 操作 的 序列 来 实现 的 。 

计算 机 不 理解 汇编 语言 ， 而 是 接受 机 器 代码 的 指令 。 如 你 所 知 ， 机 器 代码 定义 了 到 状 
态 机 微 代 码 表 的 进入 点 ， 从 此 点 开始 指令 执行 过 程 。 汇 编 语言 是 这 些 机 器 语言 指令 的 人 可 
读 (human-readable) 的 形式 。 机 器 语言 指令 没有 什么 神秘 的 ， 很 快 你 就 会 理解 它们 并 看 
到 那些 引导 现代 微 处 理 器 内 部 状态 机 的 模式 。 现 在 ,我 们 将 关注 学 习 汇 编 语 言 这 个 任务 ， 
见 图 7-9。 


我 们 用 汇编 语言 将 程序 写成 : 

MOVEA.W (IEST_S,PC,D7),A0 * 我 们 将 采用 间接 寻 址 
MOVEA.W (TEST_B ,PC,D7),Al * 得 到 结束 地 址 
MOVE.B D0, (A0) 


机 器 语言 程序 如 下 : 


(A0), DO 

NEXT_LOCATION 

D0, D3 

ERROR 

#01, AO 

Al, A0 * 我 们 做 完了 吗 ? 





图 7-9 右边 方 框 中 是 用 汇编 语言 写 的 68K 代 码 片段 ， 左 边 方 框 中 是 等 价 的 机 器 语言 代码 


注意 ,我 们 在 C 或 Ct+ 中 用 前 级 “0x” 表 示 十 六 进 制 数 ， 这 是 该 语言 的 标准 化 。 

在 汇编 语言 中 则 没有 相应 的 标准 ， 不 同 的 汇编 器 开发 者 用 不 同 的 方式 表示 十 六 进 制 

数 。 在 本 课本 中 ， 我 们 将 采用 Motorola 的 惯例 ， 即 用 “$” 作 为 十 六 进 制 数 的 前 缓 。 

机 器 语言 代码 实际 上 是 汇编 程序 的 输出 。 汇 编程 序 将 你 用 文本 编辑 器 写成 的 汇编 语言 源 
代码 转换 成 相应 的 能 在 680x0 处 理 器 上 运行 的 机 器 语言 代码 。 左 边 方 框 实际 上 有 两 列 ， 虽 然 辨 
别 出 来 有 点 困难 。 左 列 从 十 六 进 制 存储 器 位 置 开始 ， 该 处 存储 了 机 器 语言 指令 。 在 本 例 中 ， 
存储 器 位 置 $00000412 存 有 机 器 语言 指令 代码 90x307B7048。 下 一 条 指令 开始 于 存储 器 位 置 
0x00000416， 包 含 的 指令 代码 是 0x327B704A。 这 两 条 机 器 语言 指令 是 由 下 面 两 条 汇编 语言 指 
令 给 出 的 : 


MOVEA.W (TEST_S,PC,D7),AO 
MOVEA.W (TEST_E,PC,D7),Al 
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很 快 你 就 会 看 到 这 些 指令 的 实际 意思 。 眼 下， 我 们 可 这 样 总 结 上 述 讨 论 : 

。 机 器 指令 代码 $307B7048 开 始 于 存储 器 位 置 $00000412， 运 行 通过 位 置 $00000415。 对 

应 该 机 器 语言 指令 的 汇编 语言 指令 是 MOVEA.W (TEST_S, PC, D7), AO。 

。 机 器 指令 代码 $327B704A 开 始 于 存储 器 位 置 $00000416， 运 行 通过 位 置 $00000419。 对 

应 该 机 器 语言 指令 的 汇编 语言 指令 是 MOVEA.W (TEST_E, PC, D7), Al, 

此 外 ， 对 于 68K 指 令 集 ， 最 小 的 机 器 语言 指令 是 16 位 长 〈4 位 十 六 进 制 数字 ) 。 虽 然 一 些 指 
令 长 到 5 个 16 位 长 ， 但 没有 比 16 位 更 短 的 指令 。 

在 汇编 语言 指令 和 机 器 语言 指令 之 间 有 一 个 1 对 1 的 对 应 关系 。 汇 编 语 言 指令 称 为 助 记 法 
(mnemonics) ， 它 们 为 该 指令 实际 是 做 什么 的 提供 速记 形式 的 线索 。 例 如 : 


MOVE.B 移动 一 个 字 节 的 数据 

MOVEA.W 将 一 个 字 的 数据 移动 到 地 址 寄存 器 

CMP.B 比较 两 个 字 节 数据 的 大 小 

BEQ 如 果 结 果 等 于 零 ， 就 转移 到 一 个 不 同 的 指令 
RDDQ.W 将 两 个 值 (快速 ) 相 加 

BRA 总 是 转移 到 一 个 新 位 置 


你 会 注意 到 ， 我 为 汇编 语言 指令 选择 了 一 个 不 同 的 字体 。 这 是 因为 具有 固定 间隙 的 字体 
(比如 “Courier”) 能 使 字符 保持 列 对 齐 ， 使 得 汇编 语言 指令 更 易 读 。 没 有 规定 你 必须 用 这 种 
字体 ， 汇 编 器 对 此 可 能 不 在 意 ， 但 如 果 你 这 样 做 ， 就 会 便于 你 阅读 和 理解 程序 。 

指令 中 告诉 计算 机 做 什么 的 部 分 称 为 操作 代码 (opcode, “operation code” 的 缩写 ) ， 该 部 
分 只 占 指令 的 一 半 ， 而 另 一 半 则 是 告诉 计算 机 如 何 执 行 该 操作 和 在 哪里 执行 该 操作 。 实 际 的 
操作 代码 (例如 MOVE.B) 实际 上 包括 一 个 操作 代码 和 一 个 修饰 符 。 操 作 代码 是 MOVE， 它 
是 说 一 些 数据 应 从 一 个 地 方 移动 到 另 一 个 地 方 。 修 饰 符 是 “.B” 后 级 ， 它 说 的 是 变 移 动 一 个 
字 节 的 数据 ， 而 不 是 一 个 字 或 长 字 。 为 了 完成 该 指令 ,我 们 必须 告诉 计算 机 ， 

1. 从 哪里 找到 数据 ( 称 为 操作 数 1) ? 

2. 将 结果 放 到 哪里 (操作 数 2) ? 

一 个 完整 的 汇编 语言 指令 必须 有 一 个 操作 代码 ， 并 可 能 有 0、1 或 2 个 操作 数 。 请 看 这 条 称 
为 NOP ( 读 作 No op) 的 汇编 语言 指令 ， 它 的 意思 是 不 做 任何 事情 。 你 可 能 会 怀疑 这 条 指令 不 
正常 ， 但 它 实际 上 是 相当 有 用 处 的 ， 编 译 器 很 好 地 利用 了 这 条 指令 ，NOP 指 令 就 是 指令 中 需 
要 0 个 操作 数 的 例子 。 

指令 CLR.L D4 是 指令 中 需要 1 个 操作 数 的 例子 ， 它 的 意思 是 将 内 部 寄存 器 的 所 有 32 位 ( 工 
修饰 符 ) 清 零 ， 即 置 为 零 。 

指令 MOVE.W D0，D3 是 需要 两 个 操作 数 指令 的 例子 。 注 意 用 逗号 分 隔 两 个 操作 数 DO 和 
D3。 指 令 告诉 处 理 器 将 16 位 的 数据 (“.W” 修 饰 符 ) 从 数据 寄存 器 D0 移动 到 数据 寄存 器 D3。 
该 操作 不 改变 D0 的 内 容 。 所 有 的 汇编 语言 程序 都 遵从 下 面 的 结构 : 





第 1 列 第 2 列 ”第 3 列 第 4 列 …… 
标号 操作 代码 操作 数 1， 操 作 数 2 * 注释 

每 条 指令 占用 一 行 的 文本 ， 开 始 于 第 1 列 ， 最 多 可 达 132 列 。 

1 标号 域 是 可 选 的 ， 但 必须 总 是 开始 于 一 行 的 第 1 列 。 我 们 很 快 就 会 讲 和 到 如 何 使 用 标号 。 
2. 接着 就 是 操作 代码 。 它 必须 用 TAB 字符 或 若干 个 空格 的 空 自 区 与 标号 分 隔 ， 而 且 必 须 
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从 第 2 列 或 更 后 面 的 列 开始 。 

3. 下 面 就 是 操作 数 ， 用 空白 区 (通常 用 tab 字 符 ) 与 操作 代码 分 隔 。 两 个 操作 数 应 该 用 吉 
号 分 隔 开 。 操 作 数 和 逗号 之 间 没 有 空白 区 。 

4. 注释 是 一 行 的 最 后 一 个 域 。 它 通常 开始 于 一 个 星 号 或 分 号 ， 这 取决 于 使 用 哪 种 汇编 器 。 
你 也 可 以 有 注释 行 ， 但 这 时 星 号 必须 在 第 1 列 。 


7.2 标号 


虽然 标号 是 可 选择 的 ， 但 它 是 汇编 语言 编程 中 的 一 个 非常 重要 的 部 分 。 当 你 给 一 个 变量 
或 常量 一 个 符号 名 时 ， 你 就 已 经 知道 如 何 使 用 标号 。 你 也 可 以 用 标号 为 函数 命名 。 在 汇编 语 
言 中 ， 我 们 通常 使 用 标号 来 指定 程序 中 一 个 指令 或 数据 的 存储 器 地 址 。 标 号 必须 在 程序 的 第 
一 列 中 定义 。 标 号 使 程序 更 易 读 懂 ， 写 程序 不 要 标号 也 行 ， 但 几乎 没有 人 这 样 做 。 标 号 使 汇 
编程 序 能 自动 〈 并 正确 地 * ) 计算 操作 数 和 目地 地 址 。 例 如 ， 考 虚 下 面 图 7-10 的 代码 片段 。 


TEST_LOOP MOVE.B (A2),D6 站 3 对 到 宝 到 进行 测试 ， 看 是 否 完成 


)， 
* 完成 了 吗 ? 
Be [NESTD6 。 * 我 们 已 经 完成 了 4 个 测试 码 
LEA ST_ADDR,AO * 在 A0 中 建立 起 始 地 址 
LEA END_ADDR,A1 * 在 Al 中 建立 结束 地 址 
JSR DO_TEST * 转 到 测试 
ADDA.W #01,A2 * 指向 下 一 个 测试 码 
BRA TEST_LOOP * 回 到 下 一 个 地 址 
DONE STOP #EXIT * 测试 结束 ， 停 止 


图 7-10 说 明 标号 用 途 的 汇编 语言 代码 片段 


图 7-10 中 的 代码 例子 有 TEST_LOOP 和 DONE 两 个 标号 ， 这 两 个 标号 分 别 对 应 于 指令 
“MOVE.B (A2), D6” 和 “STOP 红 XIT” 的 存储 器 位 置 。 当 汇编 程序 将 汇编 语言 指令 转换 为 
机 器 语言 指令 时 ， 它 会 记 住 每 条 指令 在 存储 器 中 的 位 置 。 当 它 遇 到 一 个 标号 作为 操作 数 时 ， 
就 将 标号 文本 替换 为 数字 值 。 这 样 ， 指 令 “BEQ DONE” 就 告诉 汇编 器 计算 必要 的 数字 值 ， 
使 得 当 测 试 条 件 ( 即 相等 性 ) 满足 时 ， 促 使 程序 跳 转 到 对 应 于 标号 “DONE” 的 存储 器 位 置 
的 指令 。 我 们 很 快 就 会 看 到 如 何 进行 相等 测试 。 如 果 测 试 失败 ， 就 忽略 转移 指令 而 执行 下 一 
条 指令 。 
注释 

在 更 深入 地 学 习 之 前 ， 我 们 需要 提 一 些 建议 ,使 你 采取 适当 的 形式 为 汇编 语言 程序 做 注 
释 。 如 你 在 图 7-10 中 所 见 到 的 ， 每 条 汇编 语言 指令 都 有 一 个 注释 与 其 关联 。 不 同 的 汇编 器 以 
不 同 的 方式 处 理 注释 ,一 些 汇 编 器 要 求 注释 单独 在 一 行 上 ， 并 用 一 个 星 号 “*” 或 分 号 “;” 
打头 。 与 指令 或 汇编 伪 指 令 关 联 的 注释 可 能 要 用 分 号 或 星 号 作为 注释 的 开始 ， 或 者 也 许 不 需 
要 任何 特殊 的 字符 ， 因 为 起 始 的 空格 就 定义 了 注释 块 的 位 置 。 重 要 的 一 点 是 汇编 语言 难以 从 
代码 本 身 推测 程序 的 意义 ， 在 一 个 星期 左右 过 去 后 ， 你 很 容易 忘记 你 的 那个 算法 究竟 要 用 来 
做 什么 。 

汇编 代码 应 注释 丰富 ， 不 仅 为 了 使 你 自己 清楚 ， 而 且 也 为 在 你 离开 后 其 他 要 维护 代码 的 
人 提供 方便 。 汇 编 代 码 不 能 做 到 与 有 很 好 文档 的 C++ 程序 一 样 易 读 是 没有 理由 的 。 使 用 等 于 
伪 指 令 (equate) 和 标号 可 用 来 消除 难 理解 的 数字 和 帮助 解释 代码 在 做 什么 ， 使 用 注释 块 可 解 
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释 算法 的 什么 部 分 在 进行 和 做 了 什么 假设 。 最 后 ， 对 每 条 指令 或 者 小 指令 段 进 行 注释 是 为 了 
对 正在 发 生 的 事情 做 到 绝对 清楚 。 
Steven Levy' 在 他 的 《黑客 : 计算 机 革命 的 英雄 》 一 书 中 ， 这 样 描述 一 位 MIT 的 
学 生 和 早期 程序 员 Peter Samson 的 编码 风格 : 
...Samson 虽然 极 其 硕 固 地 拒绝 在 其 源 代码 中 加 入 注释 ， 但 也 解释 在 给 定时 间 他 
在 做 什么 。 一 个 Samson 编 写 的 发 行 很 好 的 程序 有 几 百 行 汇编 语言 指令 ， 只 在 一 条 包 
含有 数字 1750 的 指令 穷 边 有 一 个 注释 。 这 个 注释 是 “RIPJSB”， 人 们 为 弄 清 其 含义 绞 
尽 脑汁 ， 直 到 一 个 人 想到 1750 年 是 巴赫 逝世 年 ，Samson 的 注释 是 : 约翰 - 塞 巴 斯 蒂 
安 . 巴赫 安息 吧 (Rest In Peace Johann Sebastian Bach ) 。 


程序 员 模型 体系 结构 


为 了 用 汇编 语言 编程 ， 我 们 必须 熟悉 处 理 器 的 基本 体系 结构 。 我 们 对 体系 结构 的 观点 称 
为 处 理 器 的 程序 员 模 型 【Programmer's Model) 。 我 们 必须 理解 体系 结构 的 两 个 方面 : 

1. 指令 集 

2. 寻 址 模式 . 

计算 机 的 寻 址 模式 描述 了 其 访问 操作 数 或 取 回 要 操作 数据 的 不 同方 式 。 寻 址 模式 还 描述 
了 操作 完成 后 对 数据 做 什么 。 对 于 如 转移 或 跳 转 到 新 地 址 这 样 的 非 顺 序 的 取 指 令 ， 寻 址 模式 
也 告诉 处 理 器 如 何 计算 目地 地 址 。 寻 址 方式 对 于 理解 计算 机 是 如 此 重要 ， 所 以 在 我 们 能 编写 
汇编 语言 程序 之 前 需要 学 习 一 点 这 方面 的 知识 。 与 C、C++ 或 JAVA 不 同 ， 在 能 够 实际 编写 一 
个 汇编 程序 之 前 ， 我 们 需要 对 于 要 编程 的 机 器 有 一 定 程度 的 理解 。 

与 C 或 C++ 不 同 ， 汇 编 语言 在 不 同 计 算 机 间 是 不 可 移植 的 ， 一 个 为 Intel 80486 写 的 汇编 语 
言 程 序 不 会 运行 于 Motorola 68000 上。 只 要 初始 源 代码 对 于 68000 指 令 集 进行 了 重新 编译 ， 那 
么 一 个 为 运行 于 Intel 80486 上 而 写 C 程 序 就 可 能 会 运行 在 Motorola 68000 上 ， 但 是 像 高 端 字 节 
序 和 低 端 字 节 序 这 样 的 体系 结构 不 同 可 能 会 引起 错误 。 

我 们 也 许 值得 停 下 片刻 反省 一 下 ， 作 为 程序 员 为 什么 学 习 汇 编 语 言 是 重要 的 。 计 算 机 科 
学 和 编程 依赖 于 对 处 理 器 及 其 局 限 性 和 效能 的 实际 知识 。 理 解 汇编 语言 就 是 理解 你 的 代码 要 
运行 于 其 上 的 计算 机 。 虽 然 如 C++ 和 JAVA 这 样 的 高 级 语言 已 经 很 好 地 抽 去 了 低级 细节 ， 但 紧 
记 这 一 点 仍 是 重要 的 : 计算 机 并 非 无 限 强 大 ， 其 资源 并 非 无 限 多 。 

汇编 语言 与 处 理 器 的 设计 紧密 关联 ， 代 表 了 从 二 进 制 指令 集体 系 结构 到 人 可 读 形式 的 第 
一 级 的 简化 。 通 常 在 汇编 语言 指令 和 其 所 产生 的 二 进 制 或 十 六 进 制 指令 之 间 有 1 对 1 的 匹配 关 
系 ， 这 与 C 或 C++ 很 不 同 ， 一 个 C 语 名 可 能 会 产生 儿 百 行 的 汇编 代码 。 

对 于 中 断 处 理 程 序 以 及 为 专用 处 理 器 (如 数字 信号 处 理 器 (digital signal processor, DSP) ) 
所 写 的 算法 ， 尤 其 需要 高 效 的 代码 。 很 多 有 经 验 的 程序 员 提出 ， 任 何 具有 绝对 确定 性 的 代码 
都 不 能 用 C 来 编写 ， 因 为 你 不 能 事先 预测 由 编译 器 所 产生 的 代码 的 执行 时 间 。 用 汇编 语言 你 就 
能 在 单个 时 钟 周期 的 级 别 上 控制 你 的 程序 。 此 外 ，C 运 行 环境 的 启动 代码 的 某 些 部 分 必须 用 汇 
编 语言 编写 ， 因 为 除非 C 代 码 在 能 够 开始 执行 之 前 就 确立 了 运行 环境 ， 用 C 或 C++ 编写 的 程序 
是 不 能 正确 运行 的 。 这 样 ， 引 导 代 码 就 趋向 于 用 汇编 语言 编号。 最后， 理解 汇编 语言 对 于 调 
试 实时 系统 也 是 极其 重要 的 。 如 果 你 曾 在 如 微软 的 Visual C++ 这 样 的 环境 中 编写 过 程序 ， 并 
且 无 意 中 进 入 过 库 函 数 ， 那 么 你 就 会 发 觉 你 已 经 深 陷 x86 汇 编 语言 中 了 。 
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Motorola 68000 微 处 理 器 体系 结构 


图 7-11 是 一 个 68K 体 系 结构 的 简化 示意 图 。 由 于 Motorola 有 很 多 的 系列 成 员 ， 所 以 这 个 特 
定 的 体系 结构 也 称 为 CPU16。CPU16 是 CPU32 体 系 结构 的 子 集 ， 而 CPU32 就 是 68020 及 其 后 续 
处 理 器 的 指令 集体 系 结构 


装 有 要 执行 -如 果 必 要 ， 


的 下 二 条 指 一 装 有 存储 器 
程序 计数 器 (PC) 32 有 效 地 址 寄存 器 (EAR) 32 读 / 写 地 址 









令 地 址 “他 





外 部 总 线 


~ 装 有 当前 执行 







通用 寄存 器 
D0...D7 
AO...A6 















A7 = 用 户 堆栈 指针 (USP) 个 字 
A7 = 管理 者 堆栈 指针 (SSP) OT 
32 
装 有 操作 数 
或 中 间 结 果 
执行 所 有 人 逻辑 或 算术 算术 和 逻辑 单元 8 
操作 (ALU) SR 
(ADD，SHIFT， 等 等 ) 平装 有 ALU 操 
作 的 结果 





图 7-11 Motorola 68K 处 理 器 的 体系 结构 


让 我 们 简单 地 认识 一 下 我 们 后 面 要 用 到 的 一 些 重要 的 功能 模块 : 
。 程序 计数 器 (program counter): 用 于 保存 要 从 存储 器 取出 的 下 一 条 指令 的 地 址 。 只 要 
处 理 器 对 当前 指令 进行 了 译 码 ， 程 序 计数 器 (PC) 就 会 被 更 新 成 存储 器 中 顺序 的 下 一 
条 指令 的 地 址 。 
。 通 用 寄存 器 (general register) : 68K 处 理 器 有 15 个 通用 寄存 器 和 两 个 专用 寄存 器 。 通 用 
寄存 器 进一步 分 为 8 个 数据 寄存 器 D0...D7 和 7 个 地 址 寄存 器 A0...A6。 数 据 寄存 器 用 于 保 
存 和 操作 数据 变量 ， 地 址 寄存 器 用 于 保存 和 操作 存储 器 的 地 址 。 两 个 专用 寄存 器 A7 和 
A7 用 于 实现 两 个 独立 的 堆栈 指针 。 我 们 将 在 课本 稍 后 讨论 堆栈 。 
。 状态 寄存 器 (status register): 状态 寄存 器 是 一 个 16 位 寄存 器 。 这 些 位 用 于 描述 每 次 指 
令 执 行 后 计算 机 的 当前 状态 。 条 件 码 寄存 器 CCR 是 状态 寄存 器 的 一 部 分 ， 它 保存 了 直 
接 与 最 近 一 条 指令 的 执行 结果 相关 的 位 。 
。 算术 和 逻辑 单元 (arithmetic and logic unit, ALU ) ， ALU 是 一 个 功能 模块 ， 所 有 的 数学 
和 逻辑 数据 操作 都 在 其 中 执行 
图 7-12 就 是 68K 体 系 结构 的 程序 员 模 型 。 它 只 关注 体系 结构 中 与 编写 程序 相关 的 细节 ， 故 
与 图 7-11 不 同 。 
在 本 课本 中 ， 我 们 不 打算 讲解 状态 寄存 器 (SR) 或 者 管理 堆栈 指针 (A7’)。 我 们 从 现在 
起 就 关注 D0...D7，A0...A6，CCR 以 及 PC。 从 这 些 寄存 器 中 ， 我 们 将 学 到 我 们 需要 知道 的 关 
于 这 种 计算 机 体系 结构 和 汇编 语言 编程 的 所 有 知识 。 
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图 7-12 68K 处 理 器 的 程序 员 模型 
条 件 码 寄存 器 
条 件 码 寄存 器 (CCR) 应 给 予 额 外 解释 。 图 7-13 中 比较 详细 地 描述 了 寄存 器 。 


DB7 DB6 DB5 DB4 DB3 DB1 


图 7-13 条 件 码 寄存 器 。 阴 影 区 的 位 没有 使 用 


CCR 包 含 5 个 条 件 位 ， 其 值 可 随 每 条 指令 的 执行 结果 而 改变 。 每 个 位 的 精确 定义 如 下 : 

。X 位 (扩展 位 ) ， 用 于 多 精度 算术 运算 

。N 位 (负数 位 ); 指出 结果 是 一 个 负数 

。Z 位 ( 零 位 ) ， 指 出 结果 等 于 0 

。V 位 (溢出 位 ): 指出 结果 可 能 超出 了 操作 数 的 范围 

。C 位 (进位 位 ): 指出 在 一 次 数学 操作 中 产生 了 进位 

这 些 位 的 重要 性 与 BEQ、BNE、BPL、BMI 等 等 这 一 族 测 试 和 转移 指令 相关 联 。 这 些 指 
令 测 试 单独 的 标志 (flag)， 即 CCR 位 ， 如 果 条 件 为 真 则 转移 ， 如 果 条 件 为 假 则 忽略 转移 而 进 
入 下 一 条 指令 。 例 如 ，BEQ 的 意思 是 相等 转移 (branch equal) 。 那 么 ， 与 什么 相等 呢 ? BEQ 
指令 实际 上 是 测试 零 标志 位 Z 的 状态 。 如 果 Z=1， 就 意味 着 寄存 器 中 的 结果 是 零 ， 所 以 我 们 执 
行 转移 。 因 此 ， 相 等 转移 就 是 这 样 一 条 指令 ， 如 果 有 一 个 最 近 的 操作 产生 了 零 结果 ， 则 它 就 
告诉 处 理 器 执行 转移 。 

但 是 BEQ 还 有 其 他 的 意思 。 假 设 我 们 想 知 道 两 个 变量 是 否 彼此 相等 ， 我 们 如 何 测试 这 个 相 
等 性 呢 ? 很 简单 ， 只 要 将 它们 相 减 。 如 果 我 们 得 到 了 结果 零 (Z=1)， 它 们 就 相等 。 如 果 它 们 彼 
此 不 相等 ， 我 们 就 得 到 非 零 的 结果 且 (Z=0)。 这 样 ， 如 果 Z=1 则 BEQ 为 真 ， 如 果 Z=0 则 BNE 
( 非 零 转 移 ) 为 真 。 如 果 N=0 则 BPL ( 正 数 转移 ) 为 真 ， 如 果 (N=1) 则 BMI (负数 转移 ) 为 真 。 

在 68K 指 令 集中 总 共有 14 个 条 件 转 移 指令 。 一 些 指 令 只 检测 单个 标志 的 条 件 ， 而 其 他 指令 
则 检测 多 个 标志 的 逻辑 组 合 。 例 如 ，BLT 指 令 (小 于 转移 ) 定义 为 ; BLT= N*V +N*(N@V) 
(不 是 定义 为 bacon ( 逢 肉 ) ，lettuce ( 黄 营 ) 和 tomato (番茄 ))。 
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7.3 有 效 地 址 


注释 : 虽然 68K 处 理 器 只 有 24 条 外 部 地 址 线 ， 但 是 在 内 部 它 仍然 是 32 位 的 处 理 器 ， 因 此 ， 
我 们 就 能 在 例子 中 将 地 址 表示 成 32 位 值 。 
现在 ， 让 我 们 回 过 头 来 考虑 指令 的 格式 。 也 许 最 常用 的 指令 就 是 移动 指令 ， 你 会 发 现 你 
在 汇编 语言 中 做 的 最 多 的 事情 就 是 将 数据 向 四 处 移动 。 移 动 指令 需要 两 个 操作 数 ， 如 下 所 示 : 
MOVE.W Source (EA) ,destination (EA) 
例如 : 
MOVE.W $4000AAO00,$10003000 


该 指令 告诉 处 理 器 将 存储 于 位 置 0x4000AA00 的 16 位 值 找 贝 到 位 置 0x10003000。 

而 且 ，MOVE 助 记 符 有 点 误导 。 指 令 做 的 是 用 源 操 作 数 覆盖 目的 操作 数 的 内 容 ， 源 操作 
数 没有 被 操作 所 改变 。 这 样 ， 指 令 完 成 后 ， 两 个 存储 器 位 置 包含 的 都 是 指令 执行 前 
$4000AA00 所 包含 的 数据 。 

在 前 一 个 例子 中 ， 源 操作 数 和 目的 操作 数 是 精确 规定 的 存储 器 地 址 ， 是 绝对 地 址 
(absolute address) 。 它 们 是 绝对 的 是 因为 指令 精确 地 规定 了 从 哪里 取 来 数据 ， 并 将 数据 放 到 
哪里 。 绝 对 地 址 只 是 68K 的 可 能 寻 址 模式 之 一 ， 我 们 称 这 些 寻 址 模式 为 有 获 地 址 (effective 
address) 。 这 样 ， 当 我 们 将 指令 的 一 般 形 式 写 成 如 下 形式 时 ， 

MOVE.W source(EA), destination(EA) 
我 们 是 在 说 ， 数 据 要 移动 的 源 地 址 和 目的 地 址 将 由 各 自 的 有 效 寻 址 模式 独立 地 决定 。 
例如 : 
MOVE.W D0,$10003000 - 
将 处 理 器 的 8 个 内 部 数据 寄存 器 之 一 (在 这 个 例子 中 是 数据 寄存 器 D0) 的 内 容 移动 到 存储 器 位 
置 $10003000。 在 这 个 例子 中 ， 用 于 源 有 效 地 址 的 模式 称 为 数据 寄存 器 直接 (data register 
direct) 寻 址 ， 而 用 于 目的 有 效 地 址 的 模式 是 绝对 寻 址 。 
我 们 也 可 以 将 移动 指令 写 为 : 
MOVE.W A0,D5 
该 指令 可 将 目前 存储 于 地 址 寄存 器 A0 中 的 16 位 字 移 动 到 数据 寄存 器 D5。 源 有 效 地 址 是 直接 地 
址 寄存 器 (address register direct) ， 目 的 有 效 地 址 是 直接 数据 寄存 器 。 


假设 地 址 寄存 器 A0 的 内 容 是 $4000AA00 (我 们 可 用 速记 符号 写成 <A0> = $4000AA00)。 


见 下 面 指令 : 
MOVE.W D5,(AO0) 
该 指令 将 数据 寄存 器 D5 的 内 容 移 动 到 存储 器 位 置 $4000AA00。 这 是 一 个 地 址 寄存 器 间接 
(address register indirect) 寻 址 的 例子 。 你 可 能 已 经 熟悉 了 这 种 寻 址 模式 ， 因 为 这 在 C++ 中 就 是 
一 个 指针 ， 地 址 寄存 器 的 内 容 就 成 为 存储 器 操作 的 地 址 。 我 们 称 之 为 间接 寻 址 (indirect 
addressing) 模式 是 因为 地 址 寄存 器 的 内 容 并 不 是 我 们 想 要 的 数据 ， 而 是 我 们 想 要 数据 的 存储 
器 地 址 。 这 样 ， 我 们 不 是 将 数据 直接 存储 到 寄存 器 A0， 而 是 间接 地 通过 将 A0 的 内 容 作 为 最 终 
目的 的 指针 ， 即 存储 器 位 置 $4000AA00。 我 们 是 通过 将 地 址 寄存 器 用 括号 括 起 来 来 指明 地 址 寄 
存 器 是 作为 指向 存储 器 的 指针 的 。 假 设 <Al>=$10003000 且 <A6>=$4000AA00， 看 下 面 的 指令 
MOVE.W (A1),(A6) 


该 指令 将 位 于 存储 器 位 置 $10003000 处 的 数据 拷贝 到 存储 器 位 置 $4000AA00。 源 有 效 地 址 模式 
和 目的 有 效 地 址 模式 都 是 地 址 寄存 器 间接 模式 。 
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让 我 们 再 看 一 个 例子 : 
MOVE.W #$234A,D2 


该 指令 将 十 六 进 制 数 $234A 直 接 放 入 到 寄存 器 D2 中 。 这 是 一 个 “立即 ” 寻 址 模式 
(“immediate”addressing mode) 的 例子 。 立 即 寻 址 存储 是 将 变量 进行 初始 化 的 途径 。 英 镑 符 
号 (#) 告诉 汇编 器 这 是 一 个 数 ， 不 是 一 个 存储 器 地 址 。 当 然 ， 只 有 源 有 效 地 址 才能 是 立即 地 
址 。 目 的 地 址 不 能 是 数 ， 它 必须 是 一 个 存储 器 位 置 或 寄存 器 。 

有 效 地 址 (EA) 规定 了 如 何 访问 指令 的 操作 数 。 不 是 所 有 的 有 效 地 址 都 能 使 用 ， 这 取决 
于 被 执行 的 指令 。 随 着 课本 学 习 的 进行 ， 我 们 还 要 更 多 地 讨论 这 个 问题 。 指 令 用 来 访问 一 个 
或 更 多 个 操作 数 的 有 效 地 址 的 业 型 实际 上 被 规定 为 指令 的 一 部 分 。 回 忆 一 下 ， 一 个 操作 代码 
字 的 最 小 尺寸 是 16 位 长 。 操 作 代 码 字 提供 了 处 理 器 需要 来 执行 指令 的 所 有 信息 ， 然 而 ， 这 并 
不 意味 着 16 位 操作 代码 字 本 身 就 包含 了 指令 的 所 有 信息 。 它 可 能 包含 了 完成 整个 指令 所 需 的 
足够 信息 (如 对 于 NOP)， 但 通常 它 只 包含 了 足够 的 信息 来 知道 为 完成 指令 还 需要 从 存储 器 中 
取出 哪些 东西 ， 所 以 ,很 多 指令 比 操作 代码 字 要 长 。 

如 果 我 们 考虑 用 基于 微 代 码 的 状态 机 来 驱动 处 理 器 ， 那 么 所 有 这 些 就 开始 有 意义 了 。 我 们 
需要 操作 代码 字 给 我 们 进入 微 代码 的 入 口 ， 这 就 是 微 处 理 器 对 指令 译 码 时 所 要 做 的 。 在 执行 整 
个 指令 的 过 程 中 ， 可 能 需要 再 出 去 到 存储 器 去 取 另 外 的 操作 数 来 完成 指令 。 它 知道 它 不 得 不 做 
这 些 另外 的 存储 器 取 数 操作 ， 因 为 由 操作 代码 字 所 定义 的 状态 机 中 路 径 预先 确定 了 这 些 操作 。 

考虑 图 7-14 所 示 的 移动 指令 的 操作 代码 的 形式 。 


15 12 11 6 5 0 


图 7-14 移动 指令 的 机 器 语言 指令 属 式 


在 操作 代码 域 可 包含 三 种 类 型 的 关于 移动 指令 的 信息 ， 这 些 是 由 DB15-DB12 这 4 个 数据 
位 来 定义 的 。 这 些 可 能 性 定义 如 下 : 


。 0001=MOVE.B 

。 0011=MOVE.W 

。0010=MOVE.L 

源 有 效 地 址 和 目的 有 效 地 址 都 是 6 位 的 域 ， 每 个 域 又 进一步 分 为 两 个 3 位 的 域 。 一 个 3 位 的 
域 称 为 寄存 器 域 (register field) ， 该 域 可 取 值 000 到 111， 对 应 于 数据 寄存 器 DO 到 D7 和 地 址 寄 
存 器 A0 到 A7 之 一 。 另 一 个 3 位 的 域 就 是 模式 域 (mode field) ， 这 个 域 描述 了 该 操作 在 用 哪 种 
有 效 寻 址 模式 。 我 们 以 后 还 会 再 回 到 这 个 问题 。 先 看 一 个 真实 的 例子 。 考 虑 指令 : 

MOVE.W #$0A55, DO 

这 条 指令 汇编 后 会 是 什么 样子 呢 ? 参 考 一 下 汇编 语言 编程 手册 。 比 如 程序 员 参 考 手 册 *?， 这 
样 会 有 助 于 你 更 好 地 理解 将 发 生 什 么 事情 。 下 面 就 是 我 们 所 知道 的 要 发 生 的 事情 。 这 是 一 条 移 
动 指令 ， 传 输 数据 的 大 小 为 16 位 ， 即 一 个 字 。 这 样 ， 操 作 代码 字 的 4 个 最 高 有 效 位 (D15~D12) 
就 是 0011。 源 有 效 地 址 (D5~D0) 是 立即 数 ， 译 码 为 111 100。 目 地 有 效 地 址 (D11~D6) 是 数 
据 寄存 器 D0， 译 码 为 000 000。 将 这 些 整 理 在 一 起 ， 就 得 到 机 器 语言 操作 代码 字 为 : 

0011 000 000 111 100， 即 $303C 

从 0011 000 000 111 100 (二 进 制 ) 到 $303C (十 六 进 制 ) 的 转换 可 能 看 起 来 有 些 费 解 ， 
因为 指令 的 位 域 通常 不 在 4 位 边界 处 对 齐 。 然 而 ， 如 果 你 从 右 向 左 进 行 ， 按 4 位 一 组 ， 你 每 次 
都 会 做 对 。 

这 就 是 指令 的 所 有 要 素 吗 ? 不 十， 因为 此 时 我 们 所 知道 的 一 切 就 是 源 操作 数 是 立即 操作 
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数 ， 我 们 还 不 知道 这 个 立即 数 是 什么 ， 所 以 ， 操 作 代码 字 告 诉 处 理 器 ， 它 还 必须 再 到 存储 器 
取 回 另 一 部 分 的 源 操作 数 。 由 于 目地 寄存 器 D0 的 有 效 寻 址 模式 是 数据 寄存 器 直接 寻 址 ， 这 样 
就 不 需要 从 存储 器 中 取 回 另外 的 信息 ， 因 为 所 有 用 于 确定 目的 地 址 的 信息 都 已 包含 在 操作 码 
字 本 身 了 。 这 样 ， 在 存储 器 中 的 完整 指令 就 是 $303C 0A55。 图 7-15 图 解 了 这 个 例子 。 












偶数 字 节 奇数 字 节 
7 -0 1 A 0 2 人 
15 14 13 12 1110 98 7 65 4321 0 
操作 代码 字 
第 一 个 字 规 定 了 操作 和 模式 
立即 操作 数 
如 果 有 的 话 ， 就 有 一 个 字 或 两 个 字 
源 有 效 地 址 扩展 
如 果 有 的 话 ， 就 有 一 个 字 或 两 个 字 
目的 有 效 地 址 扩展 去 用 | 


如 果 有 的 话 ， 就 有 一 个 字 或 两 个 字 
图 7-15 指令 MOVE.W #$0A55, D0 的 存储 器 存储 方式 
现在 ， 假 设 指令 使 用 两 个 绝对 地 址 表示 源 有 效 地 址 和 目的 有 效 地 址 
MOVE.W $0A550000,$1000BBO00 

这 个 机 器 语言 操作 代码 字 译 码 为 : 0011 001 111 111 001， 即 $33F9。 我 们 做 完了 吗 ? 还 [9] 

是 没有 ， 这 是 因为 还 有 两 个 绝对 地 址 需要 从 存储 器 中 取出 。 完 整 的 指令 如 下 : 
$33F9 0A55 0000 1000 BB00 

完整 的 指令 总 共 占 据 存储 器 5 个 16 位 字 ， 需 要 处 理 器 分 别 做 5 次 存储 器 读 操作 才能 完整 地 

得 到 这 条 指令 。 这 个 过 程 的 图 解 见 图 7-16。 


奇数 字 节 偶数 字 节 
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| 操作 代码 字 
第 一 个 字 规 定 了 操作 和 模式 
源 有 效 地 址 
高 序 字 
低 序 字 
















源 有 效 地 址 
目的 有 效 地 址 高 序 字 
目的 有 效 地 址 低 序 字 


图 7-16 指令 MOVE.W $0A550000，, $1000BB00 的 存储 器 存储 方式 


字 对 齐 
为 了 准备 好 进行 摆 在 我 们 面前 的 编程 任务 ， 我 们 需要 讨论 的 最 后 一 个 主题 就 是 存储 器 中 
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的 字 对 齐 问 题 。 我 们 在 该 课程 的 早期 接触 到 了 这 个 主题 ， 但 回顾 一 下 这 个 概念 是 值得 的 。 回 
忆 可 知 ， 我 们 通过 使 用 最 低 有 效 位 A0 来 指出 我 们 对 哪个 字 节 感 兴趣 就 能 对 单个 字 节 进 行 寻 址 。 
然而 ， 如 果 我 们 试图 访问 一 个 在 奇数 字 节 边 界 上 的 字 或 长 字 时 ， 将 会 发 生 什 么 情况 呢 ? 图 7-17 
对 这 个 问题 做 了 图 解 。 

为 了 取出 位 于 奇数 字 节 边界 的 字 ， 处 理 器 就 低 序 字 节 
必须 进行 两 次 16 位 取 数 操作 ， 然 后 丢弃 两 个 字 的 pe 
一 部 分 以 得 到 正确 的 数据 。 一 些 处 理 器 可 做 此 操 TITTTED: 
作 。 这 就 是 我 们 先前 讨论 过 的 非 对 齐 访问 NT 
(nonaligned access) 模式 的 例子 。 一 般 来 说 ， 这 图 7-17 非 对 齐 访问 的 困难 
种 类 型 的 访问 在 处 理 器 效率 方面 的 代价 非常 高 。68K 不 能 执行 这 个 操作 ， 如 果 遇 到 这 种 情况 ， 
它 将 产生 一 个 内 部 异常 。 汇 编 器 检测 不 到 它 ， 这 是 一 个 运行 时 错误 。 采 取 的 措施 就 是 绝对 不 
要 将 一 个 字 或 长 字 操作 编程 到 字 节 (奇数 ) 存储 器 边界 上 。 


阅读 程序 员 参 考 手册 


当 开始 写 汇编 语言 程序 时 ， 你 面临 的 最 令 僵 惧 的 任务 就 是 努力 理解 生产 商 的 数据 手册 。 
Motorola 68K 程 序 员 参 考 手册 是 用 我 们 称 之 为 “相当 简明 扼要 的 风格 ”写成 的 ， 它 是 为 已 经 
知道 如 何 写 汇编 语言 程序 的 人 所 提供 的 参考 ， 而 不 是 为 正在 努力 学 习 编程 方法 的 学 生 所 提供 
的 学 习 工 具 。 从 现在 开始 , 你 将 需要 程序 员 参 考 手册 , 或 者 关于 68K 汇 编 语言 编程 的 一 本 好 书 ， 
比如 Clements 的 教科 书 。 但 是 ， 当 要 写 程序 并 需要 程序 员 参 考 手 册 这 样 的 手边 参考 书 的 时 候 ， 
教科 书 就 不 是 特别 有 效率 。 幸 运 的 是 ， 从 Freescale 或 其 他 公司 网 址 ( 见 本 章 参 考 文献 中 的 
URL) 很 容易 得 到 参考 手册 的 免费 拷贝 。 

因此 ， 假 设 你 面前 有 这 本 书 ， 让 我 们 上 一 堂 速 学 课程 来 理解 Motorola 技 术 资 料 编写 人 员 
试图 想 告诉 你 的 知识 。 下 面 的 文字 类 似 于 一 条 指令 在 参考 手册 页 中 的 布局 ; 

1. 标题 : 4DDT 加 立即 数 ADDI 

2. 操作 :立即 数 十 目的 一 目的 

3. 语 法 : ADDI #<data>, <ea> 

4. 属性: 大 小 = ( 字 节 ， 字 ,长 字 ) 

5. 描述 ; 将 立即 数 加 到 目的 操作 数 ， 并 将 结果 存 到 目的 位 置 。 操 作 的 大 小 可 规定 为 字 节 、 
字 或 长 字 ， 立 即 数 的 大 小 与 操作 的 大 小 匹配 。 

6. 条 件 码 






还 演 网 





1 
3 





X N. Z V 在 








N: 若 结果 为 负 则 置 位 ， 否 则 清 零 。 
Z: 若 结果 为 零 则 置 位 ， 否 则 清 零 。 
V: 若 产生 溢出 则 置 位 ， 否 则 清 零 。 
C: 若 产生 进位 则 置 位 ， 复 杂 清 零 。 
X: 与 进位 的 情况 相同 。 

7. 指令 格式 : 





阅 艇 器 组 织 负 汇编 语言 编程 


15 14 13 12 11 10 987 6 5 4 


立 中 数 圳 


规定 了 目地 操作 数 。 只 人 允许 数据 可 改变 的 寻 址 模式 ， 如 下 所 示 : 


8. 尺寸 域 ， 
规定 了 操作 的 尺寸 
DB7 

0 

0 

1 
9. 有效 地 址 域 ， 
寻 址 模式 模式 
Dn 000 
An ~ 
(An) 010 
(An)+ 011 
一 (An) 100 
(de, Am) 101 
(ds, An, Xn) 110 


10. 立即 数 域 : (数据 紧 接 着 操作 代码 字 ) 
车 尺寸 =00， 则 数据 是 字 立 即 数 的 低 序 字 节 。 


寄存 器 


reg.num:Dn 
不 允许 
reg .num:An 


reg .num:An 


.reg.num:An 


reg.num:An 


reg.num:An 


车 尺寸 =01， 则 数据 是 整个 字 立 即 数 。 


车 尺寸 = 10， 则 数据 是 下 两 个 字 立 即 数 。 


让 我 们 一 步 一 步 地 完成 这 个 过 程 ; 


1. 指令 和 助 记 符 ; ADDI 一 立即 数 加 
2. 操作 : 立即 数 数据 + 目的 一 目的 


将 立即 数 加 入 到 目的 有 效 地 址 的 内 容 中 ， 并 将 结果 帮 回 到 目的 有 效 地 址 


3. 汇编 器 语 半 : ADDI #(data), <ea> 
这 解释 了 如 何 用 汇编 语言 写 指令 。 注 意 ， 除 了 ADD， 还 有 一 个 用 于 立即 数 加 指令 的 特殊 操作 代 
码 ， 就 是 ADDI， 虽然 你 仍然 必须 在 源 操 作 数 域 插入 # 符 号 
4. 属性 : 字 节 、 字 或 长 字 (long) 
你 可 以 加 一 个 字 节 、 一 个 字 或 一 个 长 字 。 如 果 你 略 去 .B、.W 或 工 修饰 符 ， 默 认 的 修饰 符 就 是 .W 


5. 描述 : 告知 指令 做 什么 。 


字 节 数据 


寻 址 模式 


(XXX).W 
(XXX).L 
#<data> 


(de PC) 
(ds, PC, Xn) 


3 2 1 0 


操作 代 到 | o | oo[o[o [1 | + | 。| 尺寸 | 模式 有 效 地 址 寄存 器 






操作 尺寸 


字 节 操作 
字 操 作 
长 字 操 作 


模式 
111 
111 


这 是 该 页 中 唯一 真正 的 英文 语法 ， 所 以 是 你 试图 理解 指令 一 切 情况 的 最 好 机 会 


6. 条 件 码 : 


列 出 受 指令 影响 的 条 件 码 (标志 ) 


7. .指令 格式 ; 


如 何 生成 机 器 语言 指令 。 注 意 该 指令 只 需要 一 个 有 效 地 址 
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( 续 ) 


8. 有 效 地 址 域 : 
该 指令 所 允许 的 有 效 地 址 模式 。 它 还 给 出 了 有 效 地 址 的 模式 和 寄存 器 值 。 注 意 地 址 寄存 器 不 允 
许 作 为 目的 有 效 地 址 ， 立 即 数 也 不 行 。 还 要 注意 ， 两 个 涉及 到 程序 计数 器 PC 的 寻 址 模式 也 不 允 
许 用 在 这 条 指令 中 


流程 图 


汇编 语言 程序 因 其 高 度 结构 化 的 特性 ， 非 常 适 于 用 流程 图 帮助 进行 程序 结构 的 规划 。 一 
般 来 说 ， 流 程 图 不 用 于 规划 如 C 或 C++ 这 样 的 高 级 语言 的 编写 ， 然 而 ， 流 程 图 对 于 汇编 语言 程 
序 的 规划 仍 十 分 有 用 。 

在 生成 流程 图 时 ， 我 们 用 矩形 表示 “操作 ”。 操 作 可 以 是 一 条 指令 、 若 干 条 指令 或 者 是 一 
个 子 程序 (函数 调用 )， 所 以 矩形 与 做 某 件 事 相关 联 。 我 们 用 菱形 代表 一 个 决策 点 (程序 流 控 
制 )， 用 箭头 代表 程序 流 。 图 7-18 就 是 计算 机 起 动 一 个 程序 的 简单 的 流程 图 例子 。 





图 7-18 一 个 简单 程序 的 流程 图 ， 用 于 起 动 系统 


流程 图 起 始 于 “建立 环境 ”这 个 操作 ,这 可 能 是 几 条 指令 或 几 十 条 指令 。 一 旦 确立 了 环境 ， 
下 一 个 操作 就 是 “运行 自 测试 "， 这 可 能 又 需要 几 条 指令 或 很 多 条 指令 ,具体 多 少 我 们 不 知道 ， 
要 依赖 于 应 用 。 决 策 点 要 等 待 一 个 键盘 输入 。 程 序 扫描 键盘 ， 然 后 测试 看 是 否 有 键盘 被 敲 击 。 
如 果 没 有 ， 则 返回 (循环 ) 并 继续 扫描 。 如 果 有 键盘 被 敲 击 ， 则 程序 解释 该 敲 击 并 继续 前 进 。 

流程 图 对 于 帮助 你 规划 程序 而 言 是 一 个 非常 强大 的 工具 。 不 幸 的 是 ， 大 多 数学 生 (以 及 很 多 
职业 程序 员 ) 采取 “代码 堆砌 ”的 方式 ， 就 是 立即 开始 写 代码 ， 很 像 写 一 本 小 说 。 这 可 能 就 解释 
了 为 什么 大 多 数 程序 员 穿着 便 鞋 而 不 是 篮球 运动 鞋 ， 鞋 带 也 不 系 ， 但 那 完 全 是 另外 一 个 问题 了 。 


编写 一 个 汇编 语言 程序 


记得 菜 昂 纳 多 : 迪 卡 普 里 奥 在 电影 《泰坦 尼克 号 》(Titanic) 中 有 这 样 一 句 著 名 的 台词 : 
“我 是 这 个 世界 的 国王 ! ”在 汇编 语言 编程 中 ， 你 就 是 这 个 计算 机 世界 的 绝对 君主 ， 没 有 什么 
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能 阻止 你 犯 不 可 思议 的 编码 错误 。 没 有 类 型 检查 或 编译 警告 ， 只 有 你 和 机 器 面对面 。 为 了 用 
汇编 语言 编写 程序 ， 你 必须 持续 地 了 解 系统 的 状态 。 你 必须 紧 记 你 有 多 少 存储 器 及 其 位 置 在 
哪里 ， 你 的 外 部 设备 的 位 置 以 及 如 何 访问 它们 。 简 而 言 之 ， 你 控制 一 切 并 为 一 切 负 责 。 

为 了 能 用 68K 汇 编 语言 编写 和 运行 程序 ， 我 们 将 不 是 实际 地 使 用 一 个 68K 处 理 器 。 要 用 
68K 处 理 器 ， 你 就 需要 基于 68K 系 列 处 理 器 的 计算 机 ， 比 如 最 早 的 Apple Macintosh@。 我 们 将 
采取 一 种 不 同 的 方式 来 解决 问题 ， 即 用 一 个 称 为 指令 集 模拟 器 (instruction set simulator, ISS) 
的 程序 来 代替 68K 处 理 器 。 

商业 上 可 得 到 的 指令 集 模拟 器 的 价钱 是 10 000 美 元 ， 但 我 们 的 是 免费 的 。 我 们 很 幸运 ， 
已 经 有 两 个 很 好 的 68000 处 理 器 的 模拟 器 了 。 第 一 个 模拟 器 是 由 Clements“ 和 他 在 英国 Teesside 
大 学 的 同事 一 起 开发 的 ， 可 从 他 的 网 站 下 载 。 

Kelleys 开 发 了 第 二 个 模拟 器 、 称 为 Easy68K。 这 是 一 个 更 新 的 模拟 器 ， 并 有 广泛 的 调试 
支持 ， 而 这 正 是 Teesside 版 本 所 缺乏 的 。 两 个 模拟 器 都 是 运行 在 Windows 操 作 系 统 下 的 , 而 且 ， 
Easy68K 是 为 32 位 windows 所 编译 的 ， 因 此 有 更 好 的 机 会 运行 于 Windows 2000、XP 等 这 些 操 
作 系 统 下 ， 虽 然 Teesside 模 拟 器 看 起 来 在 Windows 更 现代 的 操作 系统 版 本 下 运行 得 也 不 错 。 

模拟 器 与 集成 设计 环境 (IDE) 更 为 紧密 。IDE 在 一 个 软件 包 中 包括 了 文本 编辑 器 、 汇 编 
器 、 模 拟 器 以 及 调试 路。 模拟 器 就 像 一 个 结合 在 一 起 的 计算 机 和 调试 器 。 你 可 以 做 很 多 你 习 
惯 的 调试 操作 ， 比 如 : 

。 对 存储 器 进行 存 取 

。 检查 和 修改 寄存 器 

。 设置 断 点 

。 从 断 点 开始 运行 或 者 运行 到 断 点 

。 单 步 运行 和 观察 寄存 器 

一 般 来 说 ， 编 制 和 运行 汇编 语言 程序 是 简单 和 直截了当 的 : 

1. 使 用 你 最 喜爱 的 ASCI 文 本 编辑 器 或 者 指令 集 模拟 器 包 中 包含 的 编辑 器 ， 编 制 你 的 源 程 
序 并 以 老 版 本 的 DOS 8.3 文 件 格式 存储 。 一 定 要 用 .x68 的 扩展 名 存储 ， 例 如 ， 将 你 的 程序 存储 
为 myprog.x68。 编 辑 器 将 自动 地 在 你 的 文件 上 附加 x68 后 级 。 

2. 用 包含 的 汇编 器 对 程序 进行 汇编 。 汇 编 器 将 产生 完全 的 机 器 语言 文件 ， 所 以 你 能 在 模 
拟 器 上 运行 该 文件 。 如 果 你 的 程序 汇编 没有 错误 ， 你 就 能 接着 在 模拟 器 中 运行 它 。 汇 编 器 实 
际 上 产生 了 两 个 文件 : 一 个 完全 的 二 进 制 文件 和 一 个 列表 文件 (listfile)。 列 表 文 件 为 你 显示 
原始 源 文件 和 其 产生 的 十 六 进 制 机 器 语言 文件 。 如 果 你 的 源 文 件 存在 任何 错误 ， 则 错误 将 显 
示 在 列表 文件 输出 上 。 

在 Teesside 汇 编 器 中 ， 汇 编 语 言 程 序 运行 于 一 个 模拟 的 计算 机 上 ， 该 计算 机 有 1MB 的 存储 
器 ， 占 据 的 虚拟 地 址 范围 是 $00000...$FFFFRF。Easy86K 模 拟 器 运行 于 全 部 的 16M 地 址 空间 上 。 
Teesside 模 拟 器 包 也 有 一 些小 毛病 ， 但 总 体 来 看 ， 在 Windows 下 运行 良好 。 

为 了 用 汇编 语言 编程 ， 你 应 该 已 经 成 为 一 个 胜任 的 程序 员 。 你 应 该 已 经 修 过 几 门 编程 方 
面 的 课程 并 理解 编程 结构 和 数据 结构 。 汇 编 语 言 编程 可 能 开始 时 看 起 来 很 奇怪 ， 但 它 也 仍 是 
编程 。 虽 然 C 和 C++ 是 自由 形式 的 语言 ， 但 汇编 语言 是 非常 结构 化 的 。 而 且 ， 要 由 你 来 掌 担 资 
源 的 使 用 情况 ， 没 有 编译 器 可 用 来 为 你 做 资源 分 配 。 

不 要 为 68K 或 任何 处 理 器 的 指令 集体 系 结构 的 操作 代码 和 操作 数 的 数量 所 吓 俩 ， 真 正 的 要 
点 是 你 只 采用 这 些 可 能 指令 和 寻 址 模式 的 子 集 就 能 写 出 相当 合理 的 程序 。 不 要 为 你 可 能 会 使 
用 的 指令 数量 所 淹没 ,使 用 一 些 你 能 理解 的 指令 和 和 寻 址 模式 轻松 自在 地 写 程 序 ， 然 后 当 你 需 
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要 更 高 效 或 仅仅 是 想 扩展 你 的 技能 时 再 开始 结合 进 其 他 的 指令 和 寻 址 模式 。 

随 着 更 深入 地 了 解 面临 的 编程 问题 ， 你 自然 地 就 会 寻求 更 高 效 的 指令 和 有 效 寻 址 模式 ， 
使 你 的 工作 更 轻松 并 编写 出 更 好 的 程序 。 你 将 很 快 发 现 ， 当 我 们 考察 不 同 的 计算 机 体系 结构 
时 ， 很 少 的 程序 员 或 编译 器 利用 了 指令 集中 的 所 有 指令 。 在 大 多 数 时 间 ， 指 令 的 一 个 小 的 子 
集 就 能 使 工作 完成 得 相当 好 。 然 而 ， 也 不 时 会 出 现 问题 ， 这 就 需要 某 些 星 涩 的 指令 来 解决 。 
祝 编程 快乐 ! 


7.4 伪 操 作 代码 


实际 上 ， 你 在 程序 中 可 以 使 用 两 种 类 型 的 操作 代码 。 第 一 种 就 是 68000 处 理 器 使 用 的 实际 
指令 的 操作 代码 的 集合 ， 它 们 构成 了 68K 的 指令 集体 系 结构 。 第 二 种 就 是 称 为 伪 操 作 代 码 
(pseudo-op) 的 集合 。 这 些 代码 就 像 真正 的 操作 代码 一 样 置 于 你 的 程序 中 ， 但 它们 实际 上 是 
针对 汇编 器 的 指令 ， 告 诉 汇 编 器 如 何 对 程序 进行 汇编 。 只 要 将 伪 操 作 代码 看 作 编译 器 指示 命 
令 和 定义 语句 就 行 了 。 

伪 操作 代码 还 称 为 汇编 命令 (assembler directive) ， 它 们 被 用 于 使 程序 更 易 读 ， 或 者 用 于 
为 汇编 器 提供 关于 对 程序 如 何 进行 处 理 的 附加 信息 。 重 要 的 是 要 意识 到 ， 商 业 上 可 得 到 的 、 
具有 工业 应 用 能 力 的 汇编 器 在 任何 一 点 上 都 和 任何 现代 编译 器 同样 复杂 。 让 我 们 考察 一 些 这 
样 的 伪 操 作 代 码 。 

。ORG ( 置 起 始 值 ): ORG 伪 操作 代码 告诉 汇编 器 在 存储 器 的 哪个 地 方 开 始 汇 编程 序 。 知 道 

程序 要 放 在 存储 器 的 哪个 地 方 不 是 必要 的 ， 这 只 是 告诉 汇编 器 你 打算 要 它 在 哪里 运行 程 

序 。 如 果 你 省 略 了 ORG 语 句 ， 程 序 将 被 汇编 成 在 存储 器 位 置 $00000 处 开始 运行 。 由 于 从 

$00000 到 $003FF 的 范围 是 为 系统 向 量 保留 的 ， 所 以 我 们 通常 将 程序 “ORG” 到 从 存储 器 

地 址 $00400 处 开始 。 因 此 ， 程 序 的 第 一 行 应 该 是 : 

< 标号 > ORG $400 <* 注 释 > 

下 一 个 伪 操 作 指 令 是 置 于 你 源 程序 末尾 的 。 它 有 两 个 功能 : 首先 ， 它 告诉 汇编 器 在 这 一 
点 停止 汇编 ， 其 次 ， 它 告诉 模拟 器 从 哪里 将 程序 装 入 到 存储 器 。 

。 END ( 源 程序 结束 ): END 后 的 任何 东西 都 被 忽略 。 格 式 : 

< 无 标号 > END ”< 地 址 > 

注意 ORG 伪 指令 和 END 伪 指令 是 互补 的 。ORG 伪 指令 告诉 汇编 器 如 何 解决 地 址 引用 ， 实 际 
上 就 是 你 打算 在 哪里 运行 程序 。END 伪 指令 指示 装载 程序 (模拟 器 的 一 部 分 ) 将 程序 代码 放 
在 存储 器 中 的 哪个 地 方 。 在 大 多 数 时 间 ，ORG 和 END 的 地 址 是 相同 的 ， 但 它们 也 不 必 这 样 。 很 
有 可 能 一 个 程序 装 和 到 一 个 地 方 ， 然 后 在 运行 时 又 重 定位 到 另 一 个 地 方 。 我 们 的 意思 是 ， 你 
通常 应 该 用 下 面 的 伪 指 令 作 为 程序 的 开始 : 

ORG $400 
并 用 下 面 的 伪 指 令 作 为 程序 的 结束 ; 


END $400 
。EQU (等 于 伪 指 令 ): 等 于 伪 操 作 与 C 中 的 #define 是 一 样 的 ， 它 允许 你 为 常数 值 提供 
一 个 符号 名 字 。 和 客 式 为 : 
< 标号 > EQU < 表达 式 > <* 注 释 > 
表达 式 可 以 是 数学 表达 式 ， 但 最 有 可 能 只 是 一 个 数字 。 你 也 可 使 用 等 于 伪 指 令 来 从 其 他 
符号 值 生成 一 个 新 的 符号 值 。 然 而 ， 在 新 符号 被 求 值 时 ， 这 些 其 他 符号 的 值 必须 已 知 ， 这 意 
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味 着 你 不 能 有 向 前 引用 。 
等 于 伪 指 令 像 C 和 C++ 中 的 “#define” 命 令 ， 是 针对 C 编 译 器 的 指令 ， 用 于 将 你 源 文件 中 
的 符号 名 替换 为 数字 值 。 例 如 : 
Bit0_test EQU $01 * 隔离 出 数据 位 0 
ANDI.B #Bit0_test,D0  * D0 的 第 0 位 等 于 1 吗 ? 
以 上 指令 对 你 来 说 要 比 下 面 指令 更 富有 涵义 ， 
ANDI.B 。 #$01,D0  * 不 可 理解 的 数字 
尤其 在 你 几 天 没有 看 到 代码 之 后 更 是 如 此 。 
。SET ( 置 符 号 ): SET 与 EQU 一 样 ， 除 了 它 在 随后 可 用 于 将 符号 重新 定义 成 另 一 个 值 。 
格式 为 : 
< 标号 > ”SET < 表达 式 > 


7.5 数据 存储 伪 指 令 


下 一 组 伪 操 作 代码 称 为 数据 存储 伪 指令 (data storage directive)。 这 些 指令 的 用 途 是 指示 
汇编 器 分 配 存 储 块 ， 也 许 还 要 用 值 来 初始 化 存储 器 。 
“DC (定义 常量 ) : 生成 一 个 存储 块 ， 包 含 列 于 源 文 件 中 的 数据 值 。 格 式 为 : 


< 标号 > DC .< 尺寸 > < 项 >，< 项 >，... 
例子 
error msg DC.B 'Error 99', $0D, $0A, $00 * 错误 消息 


一 个 置 于 单 引 号 内 部 的 文本 串 被 汇编 器 解释 为 一 个 ASCII 字 符 串 。 这 样 ， 这 条 伪 指 令 就 等 
价 于 如 下 写法 : 

error msg DC.B $45, $72, $72, $6F, $72, $20, $39, $39, $0D, $0A, $00 

如 你 所 见 ， 采 用 单 引 号 就 使 你 的 意图 容易 理解 得 多 。 在 这 个 例子 中 ， 与 标号 error_msg 相 
关联 的 存储 器 位 置 将 包含 字符 串 的 第 1 个 字 节 ， 即 $45。 

。DCB (定义 常量 块 ) : 将 一 个 存储 器 块 初始 化 到 相同 的 值 。 长 度 是 字 节 、 字 或 长 字 的 数 

量 。 格 式 是 : 
< 标号 > DCB .< 尺寸 > < 长 度 >，< 值 > 


。DS (定义 存储 ) : 生成 一 个 未 初始 化 的 存储 块 。 如 果 你 需要 定义 一 个 以 后 要 用 来 存储 数 
据 的 存储 区 域 ， 就 使 用 这 个 伪 指 令 。 格 式 : 
< 标号 > ”DS .< 尺寸 > ”< 长 度 > 
。OPT ( 置 可 选项 ):， 告诉 汇编 器 ， 你 想 让 汇编 器 在 你 还 没有 明确 指出 的 地 方 生成 程序 代 
码 ， 想 让 列表 文件 如 何 被 格式 化 。 
在 这 里 值得 注意 的 唯一 可 选项 是 CRE 选 项 。 这 个 可 选项 告诉 汇编 器 在 列表 文件 上 生成 一 
个 交叉 引用 的 列表 。 当 到 了 调试 程序 的 时 候 ， 这 个 选项 具有 无 法 估量 的 价值 。 例 如 ， 考 察 情 
况 1 的 代码 块 。 
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情况 1， 没有 CRE 可 选项 的 列表 文件 


源 文件 : EXAMPLE .X68 
默认 项 : ORG $0/FORMAT/OPT A,BRL,CEX,CL,FRL,MC,MD,NOMEX,NOPCO 


2 灾 次 交大 次 灾 交 大 六 灾 六 次 六 大 六 次 次 炎炎 炎炎 闪 六 六 

3 大 

4 * 这 是 一 个 不 用 交叉 引用 的 例子 

5 * 没有 使 用 交叉 引用 

6 * 

下 突 奖 次 六 交大 次 次 次 六 灾 六 次 六 次 灾 次 次 关 六 炎炎 类 六 

8 00000400 ORG $400 

9 

10 00000400 103C0000 STRRT : MOVE.B #00,D0 
11 00000404 66FA TEST: BNE START 
12 00000406 B640 COMPARE: CMP.W D0,D3 
13 00000408 6BFC WAIT: BMI COMPARE 
14 00000400 END $400 


Lines: 14, Errors: 0, Warnings: 0. 
情况 2， 有 CRE 可 选项 的 列表 文件 


源 文件 : EXAMPLE .X68 
默认 项 : ORG $0/FORMAT/OPT A,BRL,CEX,CL,FRL,MC,MD,NOMEX,NOPCO 





1 

党 灾 交 交 央 六 炎炎 次 六 关 实 次 炎 容 六 类 六 交 炎 六 大 

x 汪 

4 * 这 是 一 个 使 用 交叉 引用 的 例子 

5 * 引用 

6 六 文大 风 太 赤 友 页 宙 责 广 炎 友 灾 完 宙 完 圳 宽 次 广 灾 

7 

8 x oy 
9 00000400 - St Bi: 
11 00000400 103C0000 START: 

12 00000404 66FA TEST: 

13 00000406 B640 COMPARE: CMP.W D0,D3 

14 00000408 6BFC WAIT: BMI COMPARE 

15 00000400 END $400 


Lines: 15, Errors: 0, Warnings: 0. 


SYMBOL TABLE INFORMATION 

COMPARE LABEL 00000406 13 14. 

START LABEL 00000400 11 12. 

TEST LABEL 00000404 12 * * NOT USED * * 
WAIT LABEL 00000408 14 * * NOT USED * * 


注意 0PT ”CRE 伪 指 令 是 如 何 生成 一 个 符号 表 的 ， 这 个 表 是 根据 你 在 程序 中 定义 的 标号 、 
它们 的 值 、 它 们 首次 被 定义 的 行 号 ， 以 及 所 有 对 它们 进行 引用 的 行 号 生成 的 。 你 很 快 就 会 看 
到 ， 这 对 你 的 调试 过 程 有 非常 宝贵 的 帮助 。 


7.6 汇编 语言 程序 的 分 析 


假设 我 们 想 将 简单 的 C 赋 值 语 句 Z=Y+24 实 现成 为 汇编 语言 程序 ， 该 程序 会 是 什么 样 的 
呢 ? 让 我 们 考察 下 面 的 简单 程序 。 假 设 Y=27， 程 序 如 下 : 


人 郑 久 器 组 织 和 汇编 语言 编程 
ORG $400 
MOVE.B Y,D0 
ADDI.B #24,DO 
MOVE.B ~ D0,Z 
STOP #$2700 
ORG $600 
Y DC.B 27 
z DS.B 1 
END $400 


站 站 着 站 站 站 站 


* 





代码 开始 处 
取 第 一 个 操作 数 


做 加 法 
做 赋值 


告诉 模拟 器 停止 
数据 区 开始 处 
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在 存储 器 中 存储 常量 27 
为 2 保留 一 个 字 节 


注意 ， 当 我 们 使 用 没有 “$” 打 头 的 数字 27 时 ， 汇 编 器 会 将 其 解释 为 一 个 十 进 制 数 。 还 要 


它 在 地 址 $400 处 定义 了 一 个 代码 空间 ， 在 $600 处 定义 了 一 个 数据 空 


$400 
Y,D0O 
#24 ,DO 
D0O,Z 


Co 
[ea] 


#$2700 


$600 
27 


$400 


将 位 于 地 址 $600(Y) 的 字 节 数据 移动 到 数据 寄存 器 ， 这 就 将 值 27($1B) 移 动 到 了 寄存 


将 字 节 数 24 ($18) 加 到 D0 的 内 容 中 ， 并 将 结果 存 回 到 D0。 
将 字 节 数据 从 DO 移动 到 存储 器 位 置 $601。( 与 行 2 保 持 一 致 ) 
这 条 指令 由 模拟 器 用 来 停止 程序 执行 ， 它 是 指令 集 模拟 器 的 产物 ， 在 大 多 数 真实 程 


广 意 那儿 个 ORG 伪 指令 ， 

间 。 下 面 是 我 们 已 经 生成 的 汇编 器 列表 文件 ， 我 们 上 略 去 了 注释 。 
1 00000400 ORG 
2 00000400 103900000600 MOVE.B 
3 00000406 06000018 ADDI.B 
4 0000040A 13C000000601 MOVE.B 
5 00000410 E722700 STOP 
6 * Coment line 
7 00000600 ORG 
8 00000600 1B Y: DC.B 
9 00000601 00000001 2: DS.B 
10 00000400 END 
让 我 们 逐 行 分 析 该 程序 ， 
行 1， ORG 语句 定义 了 程序 的 起 始点 。 
行 2: 

器 D0 中 。 
行 3: 
行 4: 
行 5: 

序 中 没有 。 
行 6: 注释 。 


行 7: ORG 指 令 复 位 汇编 器 指令 计数 器 ， 以 开始 在 地 址 $600 处 再 次 计数 ， 这 就 有 效 地 为 程 
序 定义 了 数据 空间 。 如 果 没 有 用 ORG 指 令 ， 数 据 区 就 紧 接 着 sTOP 指 令 之 后 开始 。 

行 8: 用 标号 “Y” 定 义 存储 器 位 置 $600， 并 将 其 初始 化 为 $41B。 注 意 ， 我 们 虽然 使 用 了 
擅 指 令 DC， 但 没有 什么 能 阻止 我 们 向 这 个 存储 器 位 置 写 数据 来 改变 其 值 。 

行 9: 用 标号 “Z” 定 义 存储 器 位 置 $601， 并 保留 1 个 字 池 的 存储 。 没 有 必要 对 其 初始 化 ， 


因为 它 将 呈现 加 法 的 结果 。 


行 10: END 伪 指令 。 程 序 将 装 和 地址 $400 开 始 处 。 
注意 我 们 的 实际 程序 只 有 3 条 指令 长 ， 但 其 中 两 条 指令 是 移动 指令 ， 这 是 相当 典型 的 。 你 [机 
将 会 发 现 你 的 程序 代码 的 大 部 分 被 用 来 将 变量 到 处 移动 ， 而 不 是 对 其 进行 任何 操作 。 


总 结 


"一 个 典型 的 计算 机 系统 的 存储 器 是 如 何 组 织 和 寻 址 的 。 
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。 字 节 寻 址 是 如 何 实现 的 ， 以 及 高 端 字 节 序 和 低 端 字 节 序 两 种 字 节 寻 址 方法 之 间 的 含糊 
意义 。 . 

。 汇编 语言 指令 的 基本 组 织 ， 以 及 操作 代码 字 如 何 被 解释 成 为 机 器 语言 指令 的 一 
部 分 。 

。 产 生 汇编 语言 程序 的 基本 原理 。 

。 采 用 伪 操 作 代码 来 控制 汇编 程序 的 操作 。 

。 分 析 一 个 简单 的 汇编 语言 程序 。 
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5 Charles Kelley, http://www.monroeccc.edu/ckelly/tools68000.htm. 
习题 
1. 一 个 处 理 器 的 外 部 数据 总 线 宽度 和 内 部 数据 总 线 宽度 必须 是 相 辣 的 吗 ? 论述 一 下 它们 为 什 
么 可 以 不 同 。 
2. 解释 一 下 为 什么 一 个 微 处 理 器 的 地 址 总 线 和 数据 总 线 被 称 为 是 同 质 的 ， 而 状态 总 线 被 认为 
是 异 质 的 总 线 。 | 
3. 下 面 的 所 有 指令 或 者 是 非法 的 ， 或 者 将 引起 程序 崩溃 。 对 于 每 个 指令 ， 简 要 叙述 为 什么 该 
指令 是 错误 的 。 
a. MOVE.W $1000,A3 
b. ADD.B D0,#$A369 
c.ORI.W #$55AAO007C,D4 
d. MOVEA.L D6,A8 
e. MOVE.L $1200F7,D3 
4. 用 几 句 话 简要 解释 下 面 的 每 一 个 术语 或 概念 。 
a. 高 端 字 节 序 / 低 端 字 节 序 
b. 非 对 齐 访问 
c. 地 址 总 线 、 数 据 总 线 、 状 态 总 线 
5. 考虑 下 面 的 68000 汇 编 语 言 程序 。 程 序 结束 后 ， 存 储 于 位 置 $0000A002 的 字 节 值 是 
什么 ? 
* 系统 的 等 于 伪 指 令 定义 


foo EQU SARRAA 
bar EQU $5555 
mask EQU $FFFF 
start EQU $400 
memory EQU $0000A000 
plus EQU $00000001 


magic EQU $2700 





6. 


7. 


Oo 
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* 程序 开始 于 此 
ORG start 189 
MOVE.W #foo, DO 
MOVE.W #bar ,D7 
MOVEA.L #memory, AO 
MOVEA.L 及 0 ,有 1 
MOVE .B D0，(R0) 
ADDA.L #plus,AO 
MOVE.B D7, (A0) 
ADDA.L #plus,AO0 
MOVE.W #mask, D3 
MOVE.W D3, (A0) 
MOVE.L (A1) ,D4 
SWAP D4 
MOVE.L D4,D6 
MOVE.L D6, (A1) 
STOP #magic 
END start 
考察 下 列 的 代码 片段 。 在 存储 器 位 置 $4000 的 长 字 值 是 什么 ? 
Start LEA $4000,A0 * 初始 化 A0 
MOVE.L #$AAAAFFFF ,D7 * 初始 化 D7 和 D6 
MOVE .L #$55550000,D6 
MOVE.W D7,D0 * 装 和 人 D0 
SWAP D6 * 交换 
SWAP D0 
MOVE .W D6,D0 * 装 人 D0 
MOVE.L D0, (A0) * 存储 它 


考察 下 列 每 个 Motorola 68 000 汇 编 语言 指令 ， 指 出 哪些 指令 是 正确 的 ， 哪 些 指令 是 错误 的 。 
对 于 错误 的 指令 ， 简 要 解释 为 什么 是 错误 的 。 


a. MOVE.L DO,D7 

b. MOVE.B D2,#$4A 

Cc. MOVEA.B D3,A4 

d. MOVE.W A6,D8 

e. AND.L $4000, $55AA 


4 个 字 布 的 数据 位 于 从 $4000 开 始 的 连续 存储 位 置 。 在 不 使 用 任何 附加 存储 位 置 作为 临时 存 


储 的 情况 下 ， 雁 倒 字 节 在 存储 器 中 的 次 序 。 


.考察 下 面 的 68000 汇 编 语言 代码 片段 。 在 ADDQ.B 指 令 执行 后 , D0 中 字 的 内 容 是 什么 ? 提示 


所 有 逻辑 操作 都 是 按 位 依次 进行 的 。 
MOVE.W #$FFFF,D1 

MOVE.W  #S$AAAA,DO 

EOR.W D1, D0 

ADDQ .B #01 ,DO * D0 中 字 的 内 容 是 什么 ? 


10. 考虑 下 面 的 汇编 代码 片段 。 第 4 条 指令 执行 后 ， 寄 存 器 D1 中 长 字 值 是 什么 ? 


START MOVE.L #$FA865580, DO 
MOVE.L DO, $4000 
LSL.W $4002 
MOVE.L $4000,D1 * <D1> = ? 


11. 这 个 问题 是 让 你 感受 汇编 器 和 模拟 器 的 。 在 这 个 介绍 的 末尾 是 一 个 样本 程序 ， 你 应 该 生成 一 


个 汇编 源 文件 ， 然 后 无 错误 地 对 其 进行 编译 。 一 旦 编译 正确 ， 你 接着 就 应 该 在 你 选择 的 模拟 
器 上 运行 它 ， 最 好 从 程序 开始 处 使 模拟 器 单 步 运行 。 该 习题 的 最 终 目 标 是 回答 问题 ,“ 当 程 





760 莫 了 7 全 


序 正好 要 循环 回 到 起 始 处 并 重新 开始 运行 时 ， 位 于 存储 器 位 置 $4000 的 数据 字 的 值 是 什么 ?” 


六 六 六 交 灾 次 六 妇 容 六 妆 次 灾 均 次 灾 次 交大 炎 太 妆 六 家 庆 砍 六 究 交 妆容 容积 央 次 关 吉 炎 交大 灾 灾 炎 克 让 次 灾 交 火 交 六 认 次 太 六 灾 灾 六 页 央 交 页 帘 内 站 康 宙 克 


* 我 的 第 一 个 68000 汇 编 语言 程序 。 


* 注释 行 开始 于 一 个 星 号 。 

* 如 果 有 标号 ， 如 “addr1” 和 “start”， 则 标号 必须 起 始 于 一 行 的 第 一 列 。 

* 操作 代码 (如 MOVE .W) 或 伪 操 作 代 码 ( 如 EQU) 必须 开始 于 第 二 列 或 以 后 的 列 。 

* 当心 注释 的 使 用 ， 如 果 注 释文 字 超 出 一 行 而 到 了 下 一 行 ， 而 你 又 忘 了 使 用 星 号 ， 则 你 将 会 得 到 一 
”个 汇编 错误 。 


* EQUates 部 分 的 开始 ， 就 像 C 中 的 #define 一 样 。 


克 克 灾 风 关头 内 太太 灾 火 实 站 克 灾 内 六 交 入 灾 去 六 尖 风 大 大 灾 容 容 让 坟 太 炎 次 六 宙 贞 六 次 次 潍 六 六 灾 灾 六 太太 光 广 六 次 突 炎 宙 六 内 容 直 六 确实 内 交 克 禄 灾 六 


adqQr1 EQU $4000 
aqqQr2 EQU $4001 
data2 EQU $A7FF 
Gata3 EQU $5555 
data4 EQU $0000 
data5 EQU 4678 
dataé EQU g01001111 
data7 EQU %00010111 


宙 训 灾 太 灾 类 灰 宙 六 灾 册页 六 灾 灾 区 太 奖 次 突 六 内 突 灾 灾 交 宙 突 灾 六 妇 灾 内 宙 裕 妆 突 风 商 交 交 灾 突 雄关 灾 容 宙 六 家 突 次 交 克 灾 究 次 宙 记 大风 炎 交 妆 家 内 六 福 
* 代码 段 的 开始 。 这 些 是 实际 的 汇编 语言 指令 。 
x 


六 灾 炊 克 交 大 大 类 火光 碳 交 克 坟 大 内 宙 风 风灾 六 突 炎 灾 次 丰 交 突 宙 突 宙 次 六 突 宙 次 次 次 次 六 大 站 交大 妆容 宙 六 六 庆 实 次 实 祷 实 克 有 站内 究 闪 内 育 六 六 坎 记 究 突 


ORG $400 * 程序 开始 于 $400 
start MOVE.W #data2, D0 * 装 入 D0 
MOVE.B #data6, D1 * 装 入 D1 
MOVE.B #data7, D2 * 装 入 D2 
MOVE.W #data3 ,D3 * 装 入 D3 
MOVEA.W  #addr1,A0 * 装 入 地 址 寄存 器 
MOVE.B D1, (AO)+ * 将 字 节 传送 到 存储 器 
MOVE.B D2, (AO)+ * 传送 第 2 个 字 节 
MOVEA.W  #addr1,Al * 装 入 地 址 
AND.W D3, (A1) * 逻辑 与 
* 在 这 里 结束 。 下 个 指令 显示 如 何 使 用 标号 。 
JMP start * 程序 永远 循环 
END $400 * 在 这 里 结束 汇编 


程序 的 注释 : 
1.“EQU”、“END $400” 以 及 “ORG $400” 指 令 是 伪 操 作 指令 。 它 们 是 为 汇编 器 设置 的 指 
令 ， 不 是 68000 机 器 指令 ， 不 产生 任何 68000 代 码 。 


2. 还 要 注意 默认 的 数 制 是 十 进 制 。 要 写 一 个 二 进 制 数 ， 如 00110101， 你 就 应 该 采用 一 个 百 分 


符号 写成 %00110101。 十 六 进 制 数 ， 如 72CF， 则 采用 美元 符号 写成 $72CF。 

3. 注意 每 条 指令 都 被 注释 了 。 

4. 观察 代码 。 注 意 多 数 指令 只 是 到 处 移动 数据 ， 这 在 汇编 语言 编程 中 很 平常 。 

5. 指 令 AND.W D3， (A1) 是 另 一 种 寻 址 模式 的 一 个 例子 ， 这 种 模式 称 为 间接 寻 址 (indirect 
addressing)。 在 C++ 中 ， 我 们 称 此 为 指针 。 包 围 A1 的 圆 括 号 的 意思 是 内 部 寄存 器 A1 包 含 的 
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内 容 应 该 是 一 个 存储 器 地 址 而 不 是 一 个 数据 值 。 这 条 指令 告诉 计算 机 取出 存 于 寄存 器 D3 中 
的 16 位 量 ， 并 与 存 于 Al 寄存 器 所 指向 地 址 中 的 16 位 值 进 行 与 操作 ， 然 后 将 结果 回 送 到 Al 所 
指向 的 存储 器 位 置 。 

6. 指令 MOVE.B D1， (AO0)+ 是 带 后 递增 的 间接 寻 址 (indirect addressing with post 
increment) 的 一 个 例子 。 指 令 将 一 个 字 节 的 数据 (8 位 ) 从 内 部 数据 寄存 器 D1 移动 到 地 址 
寄存 器 A0 的 内 容 所 指向 的 存储 器 位 置 。 这 种 方式 类 似 于 前 面 的 指令 。 然 而 ， 一 旦 指令 执行 ， 
A0 的 内 容 就 会 递增 一 个 字 节 ， 所 以 A0 将 指向 存储 器 的 下 一 个 字 节 。 
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第 8 章 “汇编 语言 程序 设计 


学 习 目 标 

。 像 计算 机 中 表示 的 那样 处 理 负 数 和 实数 ， 

。 编 写 带 有 循环 结构 的 程序 ， 

。 使 用 68000 ISA 的 最 常用 寻 址 模式 编写 汇编 语言 程序 ， 

。 将 C++ 语 言 的 标准 程序 控制 结构 表示 为 汇编 语言 中 等 价 的 结构 ， 
。 使 用 程序 栈 指针 寄存 器 编写 包含 子 程序 调用 的 程序 。 


8.1 引言 


在 第 7 章 中 ， 我 们 介绍 了 汇编 语言 程序 的 基本 结构 。 这 一 章 我 们 将 继续 学 习 68K 的 寻 址 模 
式 ， 然 后 学 习 一 些 高 级 的 汇编 语言 程序 结构 ， 例 如 循环 和 子 程序 ， 目 的 是 要 使 用 尽量 多 的 新 
方法 以 提高 我 们 用 汇编 语言 设计 程序 的 能 力 。 

由 于 已 经 懂得 怎样 使 用 诸如 C、C++ 和 Java 等 高 级 语言 编写 程序 ， 我 们 将 根据 这 些 已 经 熟 
悉 的 程序 结构 〈 例 如 DO、WHILE 和 FOR 循环 ) 来 学 习 与 它们 类 似 的 汇编 语言 结构 。 记 住 ， 你 
用 C 或 C++ 编写 的 任何 代码 最 终 都 会 编译 成 机 器 语言 ， 所 以 每 一 个 高 级 语言 结构 必然 有 一 个 汇 
编 语言 类 似 结构 。 

学 习 汇编 语言 程序 设计 的 最 好 途径 之 一 是 仔细 分 析 一 个 汇编 语言 程序 。 学 习 大 量 的 指令 
本 身 没 有 太 大 的 用 处 ， 因 为 一 旦 你 熟悉 了 68K 的 程序 员 模 型 以 及 寻 址 模式 ， 你 就 可 以 在 参考 手 
册 中 找到 你 需要 的 指令 并 从 那里 开始 编写 程序 。 因 此 ， 我 们 将 精力 集中 学 习 程序 是 怎样 设计 


”和 编写 的 ， 然 后 学 习 儿 个 示例 程序 来 理解 它们 的 工作 原理 。 


数值 表示 


在 我 们 深入 探究 汇编 语言 的 奥秘 之 前 我 们 需要 先 学 习 一 些 零碎 的 知识 ， 特 别 是 ， 我 们 需 
要 学 习 各 种 不 同类 型 的 数字 是 怎样 存储 在 一 台 计 算 机 中 的 。 到 目前 为 止 ， 我 们 只 是 在 给 定数 
字 的 二 进 制 位 数 的 情况 下 ， 从 数字 范围 的 角度 考察 了 正 数 。 

可 以 表示 的 最 大 正 数 为 : 

2 一 ] 
其 中 N 是 二 进 制 位 数 。 
因此 ， 我 们 可 以 表示 的 正 整 数 范围 如 下 : 


二 进 制 位 数 最 大 值 名 字 C 语 言 中 等 价 名 字 


4 15 半 字 节 (nibble) -- 
8 255 字 节 (byte) char 
16 65 535 字 (word) short 
32 4 294 967 295 长 字 (long) int 
64 18 446 744 073 709 551 616 长 长 字 (long long) 
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很 明显 ， 这 里 遗漏 了 两 类 数 : 负数 和 实数 。 我 们 先 看 负数 然后 再 看 实数 。 

对 你 来 说 可 能 很 奇怪 ，68K 内 没有 用 于 从 一 个 数 减 去 另 一 个 数 的 电路 。 然 而 ， 减 法 是 非常 
重要 的 ， 不 仅 因为 它 是 4 种 常用 算术 运算 (加 、 减 、 乘 、 除 ) 之 一 , 而且 因为 它 是 用 来 判断 一 
个 值 等 于 、 大 于 或 小 于 另 一 个 值 的 基本 方法 。 这 里 包含 所 有 的 比较 操作 ， 诸 如 CMP 或 CMPA 
之 类 的 比较 指令 的 目的 是 设置 条 件 控制 寄存 器 (CCR) 中 的 相应 标志 ， 但 并 不 改变 比较 中 用 
到 的 任何 数 。 因 此 ， 若 我 们 执行 指令 :; 

test CMP.W DO,D1 * <DO> = <DL> ? 
那么 如 果 <D0> = <D1>， 则 零 标志 位 将 被 设置 为 1， 因 为 这 相当 于 将 这 两 个 值 相 减 ， 如 果 减 法 
的 结果 等 于 0， 和 那么 这 两 个 数 必 然 相 等 。 即 使 你 现在 还 不 清楚 ， 也 没有 关系 ， 我 们 将 在 这 一 章 
的 后 面 更 详细 地 讨论 CCR 。 

为 了 在 68K 体 系 结构 中 将 两 个 数 相 减 ， 有 必要 将 减 数 转换 为 负数 然后 再 将 两 个 数字 加 在 一 
起 。 这 样 : 

A-B=A+(-B) 

68K 处 理 器 中 加 在 一 起 的 数字 既 可 以 为 正 数 又 可 以 为 负数 。 你 编写 的 算法 必须 利用 进位 位 
C， 负 数位 N， 溢 出 位 V 和 扩展 位 C 来 决定 操作 的 上 下 文 情 况 。 处 理 器 也 必须 使 用 负数 来 向 后 
跳 转 ， 它 是 通过 将 一 个 负数 加 到 程序 计数 器 PC 的 内 容 来 实现 的 ， 这 有 效 地 在 程序 流 中 产生 了 
向 后 跳 转 。 为 什么 是 这 样 的 呢 ?” 这 值得 稍微 说 明 一 下 。 回 忆 可 知 ， 一旦 一 个 操作 代码 字 被 解 
码 ， 计 算 机 就 知道 当前 正在 执行 的 指令 中 包含 有 多 少 个 字 。 它 首先 做 的 一 件 事 就 是 将 PC 增加 
一 定 的 值 以 使 PC 中 包含 的 值 为 下 一 条 即将 要 执行 的 指令 地 址 。 

转移 指令 通过 简单 地 将 其 操作 数 加 到 PC 中 来 促使 处 理 器 执行 一 条 非 顺 序 指令 ， 该 操作 数 
称 为 位 移 〈displacement) 。 若 位 移 为 正 数 ， 那 么 该 转移 就 向 前 进行 ， 如 果 位 移 是 一 个 负数 ， 
那么 转移 就 向 后 进行 。 

为 了 将 一 个 数 从 正 数 转换 为 负数 ， 我 们 将 它 转换 为 它 的 补 码 (two's complé&ment) 表示 ， 
这 是 一 个 两 步 的 过 程 。 

步骤 1: 字 节 、 字 或 长 字 中 的 各 位 取 反 码 。 求 各 位 的 反 码 就 是 每 个 1 变 为 0， 每 个 0 变 为 1。 
这 样 ， 取 反 (01010101) = 10101010， 故 $55 的 反 码 就 是 $AA。00 的 反 码 是 $FF， 如 此 等 。 

步骤 2: 将 补 码 加 1。 因 此 --$55 = $AB。 

补 码 是 称 为 基 补 码 (radix complement) 的 减法 中 的 一 种 。 当 你 使 用 2、8、10、16 或 任意 
其 他 的 基数 系统 时 这 种 减法 仍然 可 以 正确 地 工作 。 这 种 方法 的 优点 在 于 只 保留 一 种 算术 运算 
(加 法 )， 并 通过 将 减 数 转 换 为 负数 来 处 理 减 法 。 

对 于 以 特定 基数 (radix) 表示 的 数字 N， 若 包含 d 位 数字 ， 则 其 基 补 码 定义 如 下 : 

非 零 值 N 的 基 补 码 = r*-N，0 的 基 补 码 为 0。 换 名 话说， 一 0 = 0。 

让 我 们 看 看 对 于 十 进 制 数字 4 934， 怎 样 求 其 基 补 码 。 因 为 ?一 N = 104~4 934 = 5 066， 所 
以 5 066 等 于 -4 934。 我 们 从 8 013 减 去 4 934 看 看 这 是 否 真 的 有 效 。 首 先 ， 我们 将 按照 传统 的 
形式 来 完成 减法 操作 : 

8 013—4 934 = 3 079 
现在 ， 我 们 将 8 013 和 4 934 的 基 补 码 相 加 : 
8013 + 5 066 = 13 079 => 1 3079 


很 明显 ，4 位 最 低 有 效 位 是 一 样 的 ， 但 是 在 最 高 有 效 位 留 下 一 个 1。 这 是 减法 的 基 补 码 
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方法 的 传统 用 法 ， 我 们 将 弃 用 这 种 方法 。 我 们 之 所 以 留 下 这 个 数字 就 是 要 看 看 结果 是 否 大 


大 增加 。 
如 果 x = a-b， 那 么 x = a 一 (ri 一 b) = re + (a 一 b)。 因 此 ， 留 给 我 们 的 数值 结果 分 为 两 部 分 : 


基数 的 数字 宪 和 减法 的 实际 结果 。 通 过 丢弃 基 的 数字 顺 ， 我 们 就 能 得 到 想 要 的 结果 。 因 此 ， 
补 码 运算 只 是 一 种 基 补 码 运算 ， 用 于 基数 为 2 的 数字 系统 。 

为 了 将 一 个 负数 转换 回 它 的 正 数 形式 ， 可 以 用 完全 相同 的 方法 实现 补 码 转换 。 数 字 的 最 
高 有 效 位 通常 被 称 为 符号 位 〈sign bit) ， 因 为 负数 的 最 高 有 效 位 为 1， 但 这 并 不 是 一 个 严格 的 
符号 位 ， 因 为 +5 的 反 并 不 是 一 5。 

无 论 如 何 ， 这 是 一 个 次 要 的 问题 ， 因 为 如 果 操 作 结果 将 字 节 、 字 或 长 字 的 最 高 有 效 位 设 
为 1， 那 么 标志 N 将 总 被 置 位。 请 看 下 面 的 一 段 代码 ， 


例子 

ORG $400 
Start MOVE.B #00,D0O 

MOVE .B #$FF,DO 
MOVE.W #$00FF, DO 
MOVE.W #$FFFF, DO 
MOVE.L #$0000FFFF ,DO 
MOVE.L #$FFFFFFFF, DO 
END $400 


在 模拟 器 中 跟踪 这 段 代 码 时 ， 模 拟 器 显示 每 次 当前 执行 操作 结果 的 最 高 位 为 1 时 ， 位 N 
就 被 置 位 。 因此 ， 对 于 字 节 操作 ， DB7 三 1; 对 于 字 操 作 ， DB15 三 1 对 于 长 字 操 作 ， 
DB31= 1。 

下 面 是 程序 的 模拟 器 跟踪 结果 。 位 N 和 寄存 器 D0 的 内 容 用 高 亮 灰 度 显示 。 还 要 注意 模拟 
器 既 可 以 表示 正 数 也 可 以 表示 人 负数， 因此 ，$FF 在 指令 2 中 显示 为 -1， 但 在 寄存 器 中 却 显 示 为 
$FF, 


PC=000400 SR=2000 SS=00A00000 US=00000000 X=0 

A0=00000000 A1=00000000 A2=00000000 A3=00000000 N=0 
A4=00000000 A5=00000000 A6=00000000 AT=00A00000 ZzZ=0 程序 开始 
DO=00000000 D1=00000000 D2=00000000 D3=00000000 V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
----~----- >MOVE .B #0,D0 


PC=000404 SR=2004 SS=00A00000 US=00000000 X=0 
AO=00000000 Al=00000000 A2=00000000 A3=00000000 N=0 

A4=00000000 A5»00000000 A6=00000000 A7=00A00000 z=1 指令 MOVE.B #0,， DO 
D0=00000000 D1l=00000000 D2=00000000 D3=00000000 V=0 执行 完 后 
D4=00000000 D5m00000000 D6=00000000 D7=00000000 C=0 

-~-------- >MOVE .B #-1,D0 


PC=000408 SR=2008 SS=00A00000 USss00000000 X=0 
A0=00000000 Al=00000000 A2=00000000 A3=00000000 NI 

A4=00000000 A5=00000000 A6=00000000 A7=00A00000 zs0 指令 MOVE.B #-1 DO 
D0=000000FF D1=00000000 D2=00000000 D3=00000000 Ve0 执行 完 后 
D4A=00000000 D5=00000000 D6=00000000 D7=00000000 ce0 

---------- >MOVE.W #255,D0 

PC=00040C SR=2000 SS=00A00000 US=00000000 X=0 

A0=00000000 Al=00000000 A2=00000000 A3=00000000 N=0 

Ah=00000000 A5=00000000 A6=00000000 A7=00A00000 Z=0 指令 MOVE.W #255,D0O 
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DO=000000FF D1=00000000 D2=00000000 D3=00000000 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 


PC=000410 SR=2008 SS=00A00000 US=00000000 X=0 

A0=00000000 A1l=00000000 A2=00000000 A3=00000000 N=1 

A4=00000000 A5=00000000 A6=00000000 A7=00A00000 Z=0 指令 MOVE.W #-1,DO 
D0=0000FFFF D1=00000000 D2=00000000 D3=00000000 V=0 执行 完 后 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 

---------- >MOVE .L #65535,D0 


PC=000416 SR=2000 SS=00A00000 US=00000000 X=0 
A0=00000000 A1=00000000 A2=00000000 A3=00000000 N=0 

A4=00000000 A5=00000000 A6=00000000 A7=00A00000 Z=0 指令 MOVE.L #65535,DO 
D0=0000FFFF D1=00000000 D2=00000000 D3=00000000 V=0 执行 完 后 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 

己 二 忆 疡 二 二 二 区 >MOVE .L #-1,D0 


PC=00041C SR=2008 SS=00A00000 US=00000000 X=0 

A0=00000000 AL=00000000 A2=00000000 A3=00000000 N=1 

A4=00000000 A5=00000000 A6=00000000 A7=00A00000 z=0 指令 MOVE.L #-1,D0 
DO=FFFFFFFF D1=00000000 D2=00000000 D3=00000000 V=0 执行 完 后 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 








通过 创建 补 码 负 数 ， 所 有 的 算术 操作 都 被 转换 成 了 加 法 。 但 是 ， 当 我 们 使 用 负数 时 ， 数 
值 的 范围 要 减 半 。 因 此 ， 

1.8 位 数字 的 范围 是 -128 到 +127 (0 是 正 数 ) 

2. 16 位 数字 的 范围 是 -32 768 到 +32 767 

3. 32 位 数字 的 范围 是 -2 147 483 648 到 +2 147 483 647 

当 算 术 操作 超出 了 你 正在 处 理 数字 的 范围 时 会 发 生 什么 呢 ? 作为 软件 开发 者 我 可 以 肯定 
你 以 前 磁 到 过 这 种 错误 ， 这 里 有 一 个 简单 的 例子 能 说 明 这 种 错误 。 在 下 面 的 C++ 程序 中 
bigNumber 是 32 位 的 整数 ， 初 始 值 是 刚好 小 于 整数 范围 内 的 最 大 正 数 值 +2 147 483 647。 当 循 
环 并 增加 数字 10 次 后 ， 我 们 最 终 将 超出 数字 的 最 大 人 允许 值 。 我 们 可 以 看 到 输出 端的 溢出 结果 。 

很 不 幸 ， 除 非 我 们 编写 一 个 错误 处 理 程序 来 检测 这 种 溢出 ， 否 则 错误 不 会 被 发 现 。 补 码 
运算 中 也 会 磁 到 同样 的 问题 。 

补 码 表示 使 硬件 实现 更 容易 ， 但 是 对 于 粗心 的 程序 员 来 说 却 是 一 个 很 容易 犯错 的 地 方 ! 
算术 操作 的 算法 必须 小 心地 设置 ， 并 且 要 使 用 条 件 标志 来 保证 操作 正确 。 





例如 ， 当 两 个 负数 〈 字 节 ) 相 加 的 和 小 于 -128 时 会 发 生 什么 呢 ? 你 需要 考虑 溢出 的 状态 。 
在 这 种 情况 下 ， 如 果 补 码 加 法 溢出 则 V = 1， 如果 没 有 溢出 则 V = 0。 对 于 一 个 n 位 的 带 符号 数 
字 ，V = 1 意味 着 实际 结果 大 于 2” :一 1 或 小 于 -2"  ， 如 果 疫 有 溢出 标志 ， 正 数 结果 将 被 解释 为 
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负数 ， 反 之 亦 然 。 

表达 式 N XOR YY 总 是 给 出 补 码 结果 的 正确 符号 ， 这 可 能 并 不 很 明显 。 假 设 你 将 字 节 $6A 
和 $7C 相 加 ， 这 是 两 个 正 数 ， 如 果 我 们 将 这 两 个 数 加 到 一 起 就 会 得 到 $E6。 然 而 ，$E6 是 一 个 
负数 ， 计 算 机 将 它 解 释 为 -$1A， 这 是 明显 错误 的 。 溢 出 标志 必须 被 设置 为 1 且 负 数 标志 也 必 
须 设置 为 1!， 所 以 我 们 至 少 应 当知 道 结 果 的 符号 是 正 号 而 且 已 经 发 生 了 溢出 。 你 应 当 怎样 来 消 
除 这 种 情况 的 发 生 呢 ? 与 C 和 C++ 中 的 一 样 : 使 用 一 种 更 大 的 数据 类 型 。 现 在 ， 如 果 我 们 将 
$006A 和 $007C 相 加 就 会 得 到 $00E6， 但 是 这 个 数字 可 以 正确 地 解释 为 正 数 。 如 果 你 正在 将 两 
个 正 数 相 加 ， 那 么 你 还 需 注 意 进 位 标志 ， 它 可 以 告诉 你 加 法 结果 是 否 溢出 了 。 

下 面 我 们 将 学 习 怎 样 使 用 补 码 来 表示 带 符 号 数 和 将 无 符号 数 的 范围 映射 到 带 符号 数 的 范 
围 。 如 果 我 们 将 相应 的 带 符号 数 和 无 符号 数 相 对 应 ， 我 们 就 会 明白 负数 是 怎样 表示 的 。 

无 符号 的 32 位 数 0.... 2 147 483 647 12 147 483 648......... 4 294 967 295 

带 符号 的 32 位 数 0..…. 2 147 483 647 1 一 2 147 483 648 .7 一 1 

因此 ， 无 符号 数 可 以 达到 的 最 大 值 等 于 补 码 中 的 -1， 比 带 符号 数 最 大 值 大 1 的 数 就 等 于 带 
符号 数 范 围 内 的 最 大 的 负数 ( 即 最 小 数 )。 

实数 ， 即 包含 整数 部 分 和 小 数 部 分 的 数字 ， 在 大 多 数 计算 中 都 只 能 取 近 似 值 。 你 们 都 熟 
悉 浮 点 (float) 和 双 浮 点 (double) 数据 类 型 ， 这 些 都 只 能 说 是 一 个 近似 的 实数 。 在 计算 机 中 
问题 就 成 为 :“ 你 想 以 怎样 的 精度 近似 一 个 实数 ? ”我 确信 你 作为 一 个 软件 专业 人 员 永 远 都 不 
会 写 这 种 if 语 句 ， 因 为 你 知道 ， 由 于 累积 舍 入 误差 或 转换 错误 ， 这 种 测试 可 能 会 被 错误 地 通过 
或 不 通过 。 

foat a; 

float b; 

if(b< a) 

{执行 这 段 代 码 ]; 
else 
[执行 这 段 代 码 ]; 

让 我 们 来 看 看 在 现代 计算 机 中 实数 是 如 何 表示 的 。 就 像 我 们 表示 十 进 制 数字 中 的 小 数 部 
分 那样 ， 从 小 数 点 往 右 依 次 为 10 的 连续 的 负数 次 需 ， 我 们 也 用 相同 的 方法 表示 任意 基数 的 小 
数 部 分 。 因 此 ， 二 进 制 数 10100101($A5) 就 等 价 于 


2 2 2 2 2 2 2 2 2 22 23 2- 
情形 1 1 0 1 0 0 1 0 1 xX 2 
情形 2 1 0 1 0 0 1 0 1 x 2! 
情形 3 1 0 1 0 0 1 0 1 X 2 
情形 4 1 0 1 0 0 1 0 1 X 2 
情形 5 1 0 1 0 0 1 0 1 X 2 


因此 ， 二 进 制 整 数 10100101 可 以 表示 为 实数 ， 
1010.0101 x 24 
虽然 这 种 表示 形式 初 看 起 来 有 点 古怪 ， 但 其 实 这 只 是 你 已 经 熟悉 的 十 进 制 数 的 尾数 和 指 
数 表示 法 。 从 上 面 的 例子 中 你 可 以 看 到 小 数 被 限制 为 4 位 。 如 果 在 不 增加 其 他 数字 的 情况 下 再 
进一步 ， 数 字 就 成 为 : 
101.0010 x 25 
这 样 ， 当 我 们 转换 回 整 数 时 ， 我 们 的 原始 值 $A5 就 变 成 了 $A4。 如 果 你 是 一 个 会 计 师 这 是 
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可 以 的 ， 但 是 对 于 计算 机 科学 家 和 工程 人 员 来 说 却 是 不 行 的 ! 

目前 ， 我 们 将 浮 点 数 表 示 为 IEEE-754 工 业 标 准 形式 。1985 标 准 由 电子 电气 工程 协会 
(IEEE) 维护 和 出 版 , 该 标准 描述 了 计算 机 系统 中 的 单 精度 浮 点 数 和 双 精 度 浮 点 数 的 表示 格式 ， 
它 几 乎 被 广泛 地 接受 了 ， 其 原因 是 很 多 高 性 能 微 处 理 器 都 包含 片上 浮 点 单元 (FPU)。 如 果 没 
有 关于 学 点 数 表示 的 标准 ， 那 么 浮 点 数 的 表示 方法 将 留 给 微 处 理 器 公司 这样 很 多 软件 库 就 
不 再 是 在 平台 间 可 移植 的 了 。 

IEEE-754 标 准 分 别 定义 了 32 位 单 精度 浮 点 数 ，64 位 双 精 度 浮 点 数 和 128 位 四 精度 浮 点 数 的 
格式 。 图 8-1 示 意 出 对 于 每 种 格式 的 字段 划分 。 


单 精度 
双 精度 
四 精度 [5] 15 位 下 下 “| TREE | 


图 8-1 IEEE-754-1985 浮 点 数 表示 


数字 的 实际 表示 并 不 是 如 此 简单 明了 的 ， 格 式 中 还 有 很 多 字段 需要 作 进 一 步 的 解释 。 首 
先 ， 浮 点 数 表示 法 是 用 符号 和 量 级 来 表示 一 个 数 的 ， 而 不 是 补 码 的 整数 表示 法 。 符 号 位 S 为 0 
表示 正 数 ， 为 1 则 表示 负数 。 

尾数 常常 被 调整 使 之 成 为 一 个 1 到 2 之 间 的 数 。 这 样 ， 尾 数 的 表示 形式 就 与 我 们 在 科学 计 
数 法 中 的 十 进 制 数 表 示 方 式 类 似 。 通 常 ， 科 学 计数 法 中 的 一 个 数字 都 有 一 个 大 于 1 小 于 10 的 尾 
数 ， 因 此 ， 小 数 点 左边 有 一 个 数字 ， 其 余 则 为 小 数 部 分 。 

在 IEEE 标 准 中 ， 一 个 基 为 2 的 数 将 被 调整 ， 使 尾数 在 分 数 部 分 的 左边 总 有 一 个 1， 但 由 于 1 
总 在 那里 ， 所 以 它 会 被 从 数字 字段 中 忽略 掉 ， 使 得 尾数 字段 多 得 到 一 位 的 精度 。 这 样 ， 单 精 
度数 实际 上 需要 33 位 来 表示 ， 但 只 有 32 位 被 存储 ， 因 为 在 小 数 点 的 左边 总 是 一 个 1。 

指数 也 需要 探讨 一 下 。 指 数 中 没有 符号 位 ， 所 以 首先 可 能 想到 的 是 我 们 会 使 用 补 码 来 表 
示 指 数 。 这 是 一 个 很 好 的 猜想 ， 我 们 使 用 的 方法 与 补 码 在 原理 上 非常 相似 。 比 补 码 更 优越 的 
地 方 是 位 字段 的 范围 通过 一 个 偏 置 值 来 弥补 。 对 于 8 位 的 指数 ， 偏 置 值 是 127 (01111111)。 因 
此 ， 如 果 指 数 的 8 位 值 是 10000001 ， 那 么 指数 的 值 计算 如 下 ， 

129—127 = 2 


双 精 度 浮 点 数 的 偏 置 值 是 1023， 四 精度 浮 点 数 的 偏 置 值 则 为 32 767。 于 是 我 们 可 以 将 这 
些 部 分 组 合 起 来 从 而 定义 一 个 浮 点 数 N 如 下 : 
N=—1:x1.Fx2°? 
这 里 S 是 符号 位 ，F 是 尾数 的 小 数 部 分 ，E 是 指数 部 分 而 B 是 偏 置 值 。 这 样 ， 对 于 一 个 单 精度 数 ， 
我 们 可 以 表示 的 指数 范围 是 2 到 2”3。 


转移 和 程序 控制 


大 多 数 程 序 在 进行 转移 〈 非 顺序 取 指 令 ) 前 只 执行 5 到 7 条 指令 。 大 多 数 转移 指令 在 程序 
中 经 常 与 测试 指令 (CMP 指令 ) 配对 使 用 ， 这 样 在 条 件 被 测试 完 后 就 会 根据 测试 结果 马上 执 
行 转移 。 测 试 指 令 和 转移 指令 的 配对 是 一 种 通用 规则 ， 因 为 你 不 想 丢 失 标 志 的 状态 ， 这 些 状 
态 由 测试 指令 通过 执行 另 一 条 指令 来 设置 。 但 是 ， 尽 管 测试 指令 和 转移 指令 的 配对 是 最 常用 
的 配对 ,但 也 并 不 总 是 必要 的 。 请 看 下 面 的 两 段 代码 : 
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代码 段 #1 代码 段 #2 

Snippet #1 snippet #2 
MOVE.W #05,D0O MOVE.W #05 ,DO 
loop SUBI.W #01,D0 loop SUBI.W #01,D0O 
CMPI.W #00,D0 BNE loop 


两 段 代 码 运行 得 同样 好 ， 但 是 代码 段 纪 节省 了 一 条 指令 ， 因 为 零 标志 可 以 被 SUBI.W 指 令 
自动 置 位 。 使 用 指令 CMPI.W 来 测试 标志 的 状态 是 元 余 的 ， 因 为 标志 已 经 被 之 前 的 减法 指令 置 
位 了 。 你 可 能 认为 这 有 一 点 走 极 端 但 是 在 汇编 语言 中 我 们 要 考虑 这 些 事情 。 使 用 汇编 语言 
编程 的 主要 原因 之 一 就 是 能 对 系统 的 每 个 周期 进行 绝对 的 控制 。 节 省 一 条 元 余 指 令 可 以 加 速 
一 个 实时 事务 几 个 微 秒 。 这 重要 吗 ? 这 很 难 立 即 回答 ， 但 是 我 可 以 有 一 定 把 握 地 断言 作为 一 
个 软件 开发 者 ， 这 在 你 的 将 来 应 该 是 相当 重要 的 。 

条 件 代码 寄存 器 (CCR) 中 标志 (Z、N、V、X、C) 的 状态 决定 了 是 否 会 发 生 一 个 特别 
的 转移 操作 。 有 时 ， 蜡 常 处 理会 导致 转移 ， 例 如 中 断 、 总 线 错误 、 陷 阱 指令 或 其 他 错误 。 陷 阱 
(TRAP) 指令 是 非常 重要 的 ， 因 为 它们 通常 用 于 操作 系统 (O/S) 和 用 户 应 用 程序 的 接口 。 后 
面 当 我 们 将 汇编 语言 程序 与 键盘 和 显示 器 进行 接口 以 实现 用 户 LO 时 ， 我 们 就 要 用 到 陷阱 
(TRAP) 指令 。 陷 阱 ‘TRAP) 指令 提供 了 模拟 器 中 访问 操作 系统 服务 的 一 种 很 好 控制 的 方法 。 

每 条 指令 每 执行 一 次 ，CCR 中 的 状态 位 (标志 ) 都 有 可 能 改变 状态 。 因 此 ， 就 像 前 面 说 
过 的 ， 通 常 的 做 法 是 在 转移 指令 的 紧 前 面 加 入 转移 测试 指令 ， 使 得 任何 其 他 指令 都 不 能 修改 
标志 值 。 下 面 的 表格 总 结 了 CCR 寄 存 器 标志 的 意义 。 


零 如 果 结 果 为 零 则 置 为 1， 如 果 结 果 非 零 则 置 为 0 

负数 ”等 于 结果 中 的 最 高 有 效 位 (MSB) 

进位 ”对 于 一 次 加 靶 ， 如 果 操 作 数 的 MSB 产 生 进位 则 置 为 1。 如 果 发 生 借 位 也 要 置 为 1。 否 则 置 为 0 
游 出 。 如 果 有 算术 溢出 则 置 位 ， 这 意味 着 结果 不 能 用 操作 数 表示 。 否 则 和 置 为 0 

扩展 ” 对 数据 移动 指令 透明 。 当 被 算术 指令 影响 时 ， 它 与 进位 一 样 被 置 位 


转移 指令 测试 相应 CCR 标 志 的 状态 ， 不 管 是 单个 标志 还 是 标志 的 逻辑 组 合 。 如 果 逻 辑 条 
件 取 值 为 TRUE， 就 要 进行 转移 。 回 顾 可 知 ， 程 序 计数 器 (PC) 总 是 指向 即将 执行 的 下 一 条 
指令 的 地 址 。 在 从 存储 器 中 取得 下 一 条 指令 之 前 ， 对 PC 的 内 容 加 上 或 减 去 一 个 偏 移 值 (offset 
value) ， 就 能 使 处 理 器 从 一 个 不 同 的 位 置 取 下 一 条 指令 。 转 移 指令 的 操作 数 是 一 个 8 位 或 16 位 
的 偏 移 ， 称 为 位 移 (displacement)。 因 此 ， 如 果 转 移 测试 条 件 取 值 为 真 ， 则 位 移 被 加 至 PC 中 
的 当前 值 ， 这 就 形成 了 下 一 条 指令 的 地 址 。 

换 名 话说: <PC> + 位 移 一 PC 

指令 的 形式 是 : Bece < 位 移 >。 这 里 ,“cc” 是 实际 转移 的 条 件 代码 的 速记 符 。 你 必须 用 
适当 的 测试 条 件 代 奉 cc。 图 8-2 是 所 有 条 件 转移 指令 以 及 求 值 方法 的 总 结 。 

图 8-3 是 包含 三 个 条 件 转移 例子 的 一 段 代 码 。 第 一 个 转移 测试 是 以 下 指令 的 结果 : 

CMP.L (A0), DO * 读 回 

这 里 ， 寄 存 器 A0 是 指向 存储 器 中 一 个 位 置 的 指针 。 那 个 存储 器 位 置 的 值 与 D0 的 内 容 作 比较 ， 
如 果 它 们 相等 ， 就 转移 到 标识 符 addr_ok 所 指向 的 指令 (BEQ)。 

第 二 个 转移 测试 是 下 面 这 个 比较 指令 的 结果 : 

CMPI.B #max_cnt, (A3) * 我 们 是 否 已 经 访问 了 4 个 坏 地 址 ? 
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_ 外 往 大 于 在 TR 


意 义 逻辑 测试 


如 果 进 位 清 零 则 转移 
如 果 进 位 置 位 则 转移 
如 果 结 果 等 于 0 则 转移 
， 如果 结果 不 等 于 0 则 转移 
如 果 结 果 是 大 于 或 等 于 则 转移 
如 果 结 果 是 大 于 则 转移 
如 果 结 果 是 HI 则 转移 
如 果 结 果 是 小 于 或 等 于 则 转移 Z+N*V+N*V=1 
如 果 结 果 是 低 或 一 样 则 转移 C+Z=1 
如 果 结 果 是 小 于 则 转移 N*V+N*V=1 
如 果 结 果 是 负数 则 转移 
如 果 结 果 是 正 数 则 转移 N=0 
如 果 结 果 造 成 了 溢出 则 转移 
如 果 结 果 没 有 溢出 则 转移 


图 8-2 条 件 转移 指令 及 其 意义 


这 里 ， 立 即 数 max_cnt 与 A3 所 指 存储 器 地 址 处 的 内 容 进行 了 比较 。 如 果 它 们 相等 ， 就 转移 到 
标识 符 所 定义 的 指令 。 
第 三 个 转移 测试 是 下 面 这 个 比较 指令 的 结果 : 
CMPA AO, Al * 我 们 是 否 已 经 访问 了 最 后 的 地 址 ? 
tst_loop MOVE.L D0, (A0) * 将 值 载 入 存储 器 












CMP.L (A0),DO * 读 回 

BEQ addr_ ok * 测试 通过 ， 它 们 是 一 样 的 
MOVE.W AO0, (A4) * 保存 坏 地 址 位 置 

ADDQ.B #1, (A3) * 计数 器 递增 

CMPI.B #max cnt, (A3) * 我 们 是 否 已 访问 了 4 个 坏 地 址 ? 
BEQ Gone * 是 的 ， 退 出 测试 

ADDQ.L #inc addr,A0 * 地 址 指针 递增 

CMPA: AO,Al * 我 们 是 否 已 经 访问 了 最 后 的 地 址 ? 
BGE tst_loop * 没有 ， 继 续 测试 

BRA next_test * 是 的 ， 跳 到 下 一 个 测试 


退回 到 模拟 器 


标记 为 “addr_ ok” 处 的 牛人 


图 8-3 带 有 条 件 和 无 条 件 转移 的 代码 片断 


与 CMP 指 令 不 同 ，CMPA 指 令 是 在 我 们 需要 比较 一 个 地 址 寄存 器 的 值 时 被 使 用 的 。 这 里 ， 我 
们 比较 两 个 地 址 寄存 器 A0 和 Al 的 内 容 ， 若 Al 大 于 等 于 A0 就 转移 。 还 要 注意 一 点 ， 我 偶而 会 
在 尖 括 号 中 放 入 寄存 器 ， 例 如 : <A0> = 0。 这 是 “内 容 A0 = 0” 的 缩写 形式 。 你 将 发 现 有 很 
多 指令 只 用 于 地 址 寄存 器 或 数据 寄存 器 。 最 后 ， 总 是 转移 指令 (branch always, BRA) 是 用 来 
无 条 件 跳 转 到 另 一 条 指令 的 (这 一 章 不 再 说 明 )。 





> 
SS 
te 


203 


170 肿 8 本 





寻 址 模式 


到 目前 为 止 ， 我 们 主要 是 集中 精力 熟悉 了 汇编 语言 程序 设计 的 一 些 基 本 原理 。 为 了 达到 
这 个 效果 ， 我 们 忽略 了 对 68K 指 令 集体 系 结构 的 寻 址 模式 的 系统 学 习 。 在 我 们 进一步 学 习 体 
系 结构 的 其 他 方面 〈 例 如 堆栈 和 子 程序 ) 之 前 ， 我 们 至 少 需 要 简单 浏览 一 下 主要 的 寻 址 模式 。 

通过 一 些 例子 的 学 习 ， 你 可 能 马上 就 能 熟悉 大 多 数 寻 址 模式 。 下 面 所 列 出 的 寻 址 模式 
是 基于 操作 代码 字 的 有 效 地 址 域 。 这 样 ， 在 适当 的 地 方 就 有 “模式 /寄存 器 ”组 合 ， 或 者 
当 需 要 进一步 细 分 模式 时 的 “模式 / 子 类 ”组 合 。 当 我 们 讨论 寻 址 模式 时 就 会 更 清楚 了 。 

模式 0， 数 据 寄 存 器 直接 寻 址 

源 或 目的 是 一 个 数据 寄存 器 (D0...D7)。 

模式 1， 地 址 寄存 器 直接 寻 址 

源 或 目的 是 一 个 地 址 寄存 器 (A0...A6)。 

寄存 器 直接 寻 址 (register direct addressing) 是 最 简单 的 寻 址 模式 。 一 个 操作 数 的 源 或 目 
的 是 一 个 数据 寄存 器 或 地 址 寄存 器 ， 且 这 个 特定 源 寄存 器 的 内 容 提供 了 源 操作 数 。 类 似 地 ， 
如 果 一 个 寄存 器 是 一 个 目的 操作 数 ， 那 么 它 将 被 装载 为 指令 所 指定 的 值 。 下 面 这 些 例子 中 的 
源 操作 数 和 目的 操作 数 都 使 用 了 寄存 器 直接 寻 址 模式 。 


。MNOVE .B D0，D3: 将 寄存 器 D0 中 的 源 操作 数据 贝 到 寄存 器 D3 
»° SUB.L A0，D3: 从 寄存 器 D3 中 减 去 寄存 器 A0 中 的 源 操作 数 
。 CMP.W D2，D0: 将 寄存 器 D2 中 的 源 操作 数 与 寄存 器 DO 进行 比较 
»° ADD.W D3，D4; 将 寄存 器 D3 中 的 源 操作 数 加 至 寄存 器 D4 - 


寄存 器 是 计算 机 中 最 宝贵 的 资源 ， 它 们 是 计算 机 体系 结构 中 不 可 缺少 的 部 分 且 它 们 在 绝 
大 多 数 汇 编 语 言 操作 中 具有 更 快 的 访问 速度 。 大 多 数 算术 和 逻辑 操作 必须 使 用 一 个 数据 寄存 - 
器 或 地 址 寄存 器 作为 计算 中 的 操作 数 之 一 。 例 如 ，ADD 指 令 必 须 使 用 一 个 数据 寄存 器 作为 源 
操作 数 或 目的 操作 数 ， 另 一 个 操作 数 则 可 以 是 几 种 有 效 地 址 模式 之 一 。 

寄存 器 直接 寻 址 也 是 非常 高 效 的 ， 因 为 它 使 用 短 指令 ， 它 只 使 用 三 位 来 指定 8 个 数据 寄存 
器 之 一 。 寄 存 器 直接 寻 址 是 快速 的 ， 因 为 外 部 存储 器 并 不 是 必须 访问 的 。 通 常 ， 程 序 员 使 用 
寄存 器 直接 寻 址 来 保存 经 常 访问 的 变量 (也 就 是 中 间 结 果 暂 存 器 ) 。 

好 的 编译 器 利用 寄存 器 直接 寻 址 来 提高 性 能 。 实 际 上 ，C 或 C++ 中 的 声明 使 用 关键 字 
“register”: 

register int foo = 0; 

该 声明 告诉 编译 器 ， 如 果 可 能 ， 你 宁愿 将 “foo” 保 存 为 一 个 可 用 的 寄存 器 变量 而 不 是 一 个 存 
储 器 地 址 。 编 译 器 可 能 并 不 能 准予 你 的 要 求 ， 但 是 你 确实 已 经 提出 了 这 样 的 请 求 。 

跟踪 寄存 器 及 其 它们 的 内 容 以 及 最 有 效 地 使 用 它们 对 汇编 语言 程序 员 来 说 确实 相当 难 。 
当 我 们 考察 RISC 处 理 器 的 体系 结构 时 ， 这 将 变 得 更 加 明显 。RISC 处 理 器 拥有 很 大 的 寄存 器 集 
(AMD 29000 拥 有 256 个 寄存 器 ) 来 给 编译 器 提供 很 多 的 快速 局 部 存储 。 

模式 2， 地 址 寄存 器 间接 寻 址 

地 址 寄存 器 (A0 到 A6) 包含 源 操作 数 或 目的 操作 数 的 有 效 存储 地 址 ， 这 在 C 中 是 一 个 指 
针 。 我 们 也 可 以 称 这 为 间接 寻 址 ， 因 为 地 址 寄存 器 的 内 容 不 是 我 们 想 要 的 数据 ， 它 是 到 数据 
的 一 个 指针 ， 所 以 它 允 许 我 们 间接 访问 存储 器 。 
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因此 ， 在 间接 寻 址 时 ， 地 址 寄存 器 的 内 容 是 我 们 想 要 访问 的 数据 的 地 址 。 

到 现在 为 止 ， 我 们 总 是 直接 指定 源 存 储 地 址 或 目的 存储 地 址 。 通 过 使 用 地 址 寄存 器 
的 内 容 来 指定 一 个 操作 数 的 有 效 地 址 ， 间 接 寻 址 就 允许 我 们 对 地 址 进行 操作 。 如 果 你 检 
查 一 个 C 编 译 器 产生 的 汇编 语言 代码 ， 你 将 发 现 指针 被 直接 翻译 成 了 地 址 寄存 器 间接 寻 
址 模式 。 一 些 处 理 器 体系 结构 (例如 Intel 80X86 系 列 中 的 那些 ) 几乎 只 使 用 间接 寻 址 









模 式 o Registers 
在 地 址 寄存 器 间接 寻 址 (address Memory 

register indirect addressing) 中 ， 指 -一 下 

令 指 定 68000 地 址 寄存 器 A0 到 A6 之 一 上 EMGVEW (AS), D7 





来 保存 我 们 所 需 数据 的 存储 地 址 。 编 
写 汇编 语言 指令 时 ， 圆 括号 表示 某 某 
的 内 容 。 例 如 ， 指 令 MOVE .W 
(R3) ， D7 告诉 处 理 器 将 地 址 寄存 器 
A3 所 指 的 存储 地 址 处 的 内 容 载 入 数 
据 寄 存 器 D7。 源 地 址 寄存 器 包含 操 
作 数 的 地 址 ， 处 理 器 然后 访问 地 址 
寄存 器 所 指 的 操作 数 ， 最 后 ，A3 所 
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指 地 址 寄存 器 的 内 容 被 拷贝 到 数据 en 
A 图 8-4 地 址 寄存 器 间接 寻 址 模式 的 例子 
| ° 

我 们 可 以 用 状态 机 的 行为 来 解释 地 址 寄存 器 间接 寻 址 。 请 看 下 面 的 两 段 代码 


MOVE-W’? < $0600;D0 3 MOVER < #$60 
MOVE.W < D0,$4000 二 


OVER (AOIA1) | 

在 代码 段 机 中 ， 操 作 代 码 字 被 译 码 ， 说 明 源 有 效 地 址 是 一 个 绝对 字 。 这 意味 着 处 理 器 必 
须 处 理 一 些 事情 : 

1. 跳出 到 存储 器 并 读 取 指令 的 下 一 个 字 。 它 读 入 了 $0600。 

2. 将 $0600 放 置 在 地 址 总 线 上 ， 读 取 存 储 地 址 $0600 处 的 内 容 到 D0 中 。 

.在 下 一 条 指令 中 ， 目 的 有 效 地 址 是 一 个 绝对 地 址 ; 

1. 跳出 到 存储 器 并 读 取 指令 的 下 一 个 字 。 它 读 入 了 $4000。 

2. 将 $4000 放 置 在 地 址 总 线 上 ， 并 将 存储 在 DO 中 的 数据 写 出 到 地 址 $4000。 

关键 在 于 状态 机 必须 使 用 有 效 地 址 模式 以 便 决定 源 地 址 位 置 或 目的 地 址 位 置 的 值 ， 它 如 
何 按 顺 序 通 过 状态 机 在 很 大 程度 上 是 根据 地 址 模式 计算 所 确定 的 实际 存储 地 址 来 决定 的 。 一 
旦 确定 好 了 实际 地 址 值 ， 读 写 存储 器 的 顺序 就 总 是 一 样 的 。 

在 代码 段 #2 中 ， 任 务 看 起 来 稍微 复杂 一 些 ， 但 是 它 实 际 上 高 效 得 多 。 两 条 MOVEA 指 令 用 
来 为 地 址 寄存 器 A0 和 A1 装 载 初始 值 ， 于 是 下 面 的 处 理 就 更 加 高 效 了 ， 

1. 将 地 址 寄存 器 A0 的 内 容 放 置 在 地 址 总 线 上 ， 并 将 读 存 储 位 置 的 内 容 读 入 处 理 器 内 的 一 
个 暂 存 寄存 器 。 

2. 将 地 址 寄存 器 Al 的 内 容 放置 在 地 址 总 线 上 ， 并 将 暂 存 寄 存 器 的 内 容 写 出 到 那个 存储 
位 置 。 

注意 在 上 面 的 例子 中 ， 一旦 将 开始 地 址 值 装 载 到 了 地 址 寄存 器 ， 我 们 就 不 再 关心 这 
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些 值 是 什么 了 。 我 们 能 完成 地 址 值 的 各 种 增 减 操作 ， 也 能 正确 处 理 存储 器 的 装载 和 存储 
操作 。 

我 希望 读者 们 明白 的 是 地 址 寄存 器 间接 寻 址 是 一 种 功能 非常 强大 的 寻 址 模式 。 实 际 上 ， 
相对 于 其 他 模式 ， 你 可 能 更 常 使 用 这 种 模式 。 它 如 此 重要 的 原因 是 因为 间接 寻 址 使 我 们 可 以 
在 程序 执行 过 程 中 计算 存储 地 址 ， 而 不 是 程序 被 汇编 过 程 中 将 地 址 固定 。 这 样 ， 如 果 能 够 计 
算 一 个 地 址 ， 那 么 我 们 就 能 够 很 简单 地 通过 表格 和 结构 进行 移动 。 

模式 7， 子 类 4: 立即 姓 址 

以 符号 # 打 头 的 源 值 是 数据 而 不 是 一 个 存储 地 址 。 立 即 操作 数 也 被 称 为 文字 操作 数 。 我 们 
最 常 使 用 立即 寻 址 模式 来 初始 化 变量 或 提供 程序 中 的 常用 数字 。 当 要 使 用 立即 寻 址 时 请 牢记 
下 面 重要 的 两 点 : 

1. 立即 寻 址 模式 只 能 用 于 指定 源 操作 数 (source operand) ， 因 为 你 不 能 将 一 个 数字 ( 数 
据 ) 存储 到 一 个 数字 中 。 : 

2. 你 必须 在 数值 前 添加 一 个 # 号 来 告诉 汇编 器 这 是 立即 数 ， 否 则 ， 它 可 能 被 解释 为 一 个 存 
储 位 置 。 这 可 能 是 一 个 很 难 发 现 的 错误 ， 因 为 你 得 不 到 汇编 器 错误 ， 以 指明 是 一 个 存储 地 址 
而 不 是 一 个 数字 。 

例如 ， 指 令 

MOVE.B #4, DO 
使 用 了 一 个 文字 源 操 作 数 和 一 个 寄存 器 目的 操作 数 。 文 字源 操作 数 4 是 指令 的 一 部 分 ， 目 的 寄 
存 器 D0 使 用 寄存 器 直接 寻 址 模式 寻 址 。 指 令 的 每 个 操作 数 都 能 使 用 一 种 不 同 的 寻 址 模式 。 该 
指令 的 作用 是 将 文字 值 4 拷 贝 到 数据 寄存 器 D0 中 。 


模式 7， 子 类 000: 绝对 寻 址 ( 字 ) 

存储 位 置 被 显 式 地 指定 为 一 个 16 位 字 。 但 是 ， 由 于 68K 体 系 结构 的 全 地 址 是 32 位 长 ， 所 以 
这 种 寻 址 模式 使 用 了 16 位 符号 扩展 地 址 (sign extended address)。 地 址 操作 数 中 的 最 高 有 效 位 
被 用 来 填充 A15 到 A31 的 所 有 高 地 址 位 。 如 果 MSB = 0， 那 么 地 址 就 是 较 低 的 32K 
(A0...A14) ， 如 果 MSB = 1， 那 么 地 址 就 是 较 高 的 32K。 

例如 ， 如 果 16 位 地 址 是 $B53C， 即 二 进 制 的 1011 0101 0011 1100， 那 么 “符号 扩展 ”的 
32 位 地 址 就 是 $FFFFB53C。 如 果 16 位 地 址 是 $7ABC， 即 二 进 制 的 0111 1010 1011 1100， 那 么 
符号 扩展 地 址 就 是 $00007ABC。 

你 可 能 感到 疑惑 ,，“ 为 什么 要 这 么 麻烦 呢 ?” 首 先 ， 绝 对 短 地 址 (或 字 ) 这 种 地 址 形式 节 
省 了 存储 空间 并 且 速 度 更 快 ， 因 为 它 从 存储 器 中 少 取 了 一 个 扩展 字 。 其 次 ， 大 多 数 ROM 代 码 
存 于 低 存 储 位 置 而 RAM 代 码 存 于 高 存储 位 置 。 例 如 ，68K 的 异常 向 量 表 就 位 于 存储 器 中 最 开 
始 的 256 个 长 字 位 置 。 

模式 7， 子 类 001: 绝对 寻 址 (长 字 ) 

存储 位 置 被 显 式 指定 为 一 个 32 位 字 。 操作 数 的 实际 地 址 被 包含 在 紧 跟 指 令 字 的 两 个 字 中 。 
当 从 存储 器 中 读 出 两 个 地 址 字 后 ， 被 操作 的 数据 就 从 外 部 的 32 位 存储 地 址 处 读 取 ， 这 里 的 32 
位 存储 地 址 是 通过 连接 高 位 字 和 低位 字 以 形成 全 存储 地 址 而 得 到 的 。 

由 于 68K 只 有 24 个 外 部 地 址 位 ， 这 就 存在 一 个 叫做 混 清 (aliasing) 的 隐 含 问题 。 混 淆 是 
不 留心 复制 一 个 地 址 的 一 种 结果 。 请 记 住 一 个 32 位 全 地 址 可 能 包含 256 个 24 位 页 ， 所 以 最 好 的 


办 法 是 尽量 保持 所 有 的 高 地 址 位 《A24 到 A31) 等 于 0。 


在 直接 寻 址 或 绝对 寻 址 中 ， 指 令 提 供 了 操作 数 在 存储 器 中 的 地 址 。 直 接 寻 址 需要 两 次 存 
储 器 访问 才能 取 到 完整 的 指令 : 第 一 次 是 访问 指令 ， 第 二 次 是 访问 实际 操作 数 。 例 如 ， 指 令 





CLR.B 1234 清 空 ( 置 为 0) 存储 位 置 1234 处 的 内 容 。 

尽管 看 起 来 非常 直接 ， 但 绝对 寻 址 并 不 经 常 使 用 。 除 了 在 最 简单 的 计算 机 系统 中 ， 我 们 
都 需要 一 种 灵活 性 ， 就 是 在 不 考虑 代码 实际 位 置 的 情况 下 在 存储 器 中 任意 移动 代码 。 绝 对 寻 
址 不 允许 代码 重 定位 ， 而 且 它 减 慢 了 处 理 器 速度 ， 因 为 为 了 确定 操作 数 的 存储 地 址 必须 进行 
多 次 的 存储 器 访问 。 

模式 3， 带 后 递增 的 地 址 寄存 器 间接 寻 址 

地 址 寄存 器 (A0…A6) 包含 源 有 效 地 址 或 目的 有 效 地 址 。 当 指令 被 执行 完 后 ， 地 址 寄存 
器 的 内 容 就 递增 1， 这 是 68K 实 现 退 栈 (POP) 操作 的 办 法 。 

模式 4， 带 前 递减 的 地 址 寄存 器 间接 寻 址 

地 址 寄存 器 (A0…A6) 包含 源 有 效 地 址 或 目的 有 效 地 址 。 在 指令 被 执行 之 前 ， 地 址 寄存 
器 的 内 容 就 递减 1， 这 是 68K 实 现 压 栈 (PUSH) 操作 的 办 法 。 我 们 将 在 后 面 一 部 分 讨论 堆栈 
的 压 栈 (PUSH) 操作 和 退 栈 (POP) 操作 。 

模式 3 和 模式 4 是 称 为 自动 增 量 (auto-incrementing) 的 一 种 通用 寻 址 方法 的 例子 。 如 果 寻 
址 模式 被 指定 为 (A0)+， 在 被 使 用 后 地 址 寄存 器 的 内 容 就 递增 。 例 如 : 假设 地 址 寄存 器 A3 包 含 
值 $9AB4， 当 被 用 作 一 个 间接 指针 时 它 指向 存储 地 址 $00009AB4。 假 定 我 们 将 要 执行 指令 

ADD.L (A3)+, D4 
简单 的 说 ， 这 条 指令 将 把 源 有 效 地 址 的 内 容 加 至 目的 有 效 地 址 的 内 容 ， 并 用 新 值 替 换 目 的 有 效 
地 址 中 的 内 容 。 因 为 寄存 器 A3 的 内 容 <A3> = $9AB4， 所 以 ， 存 储 位 置 $9AB4 处 的 长 字 内 容 被 
加 至 寄存 器 D4 的 内 容 中 并 将 结果 存 回 D4。 还 需要 增加 地 址 寄存 器 A3 的 内 容 才 能 完成 指令 。 应 
该 增加 多 少 呢 ? 如 果 你 回答 1， 那 还 是 留 给 你 自己 吧 。 因 为 操作 发 生 在 长 字 量 级 上 ， 所 以 应 该 
是 <A3> 一 <A3 + 4>， 即 $9AB8。 因 此 ， 递 增 操作 的 大 小 必须 与 正 被 操作 的 操作 数 大 小 相 匹配 。 

如 果 指 令 ADD.L (A3)+， D4 后 的 指令 是 跳 回 程序 的 转移 语句 ， 那 么 结果 就 是 不 断 将 
连续 存储 位 置 处 的 内 容 加 至 D4。 自 动 递增 指令 是 非常 有 用 的 ， 因 为 很 多 存储 位 置 都 是 有 序 排 
列 的 数据 ， 就 如 你 马上 会 看 到 的 一 样 ， 自 动 递 增 指令 还 被 用 来 实现 基于 堆栈 的 寻 址 操作 。 

让 我 们 通过 一 段 示 例 代 码 来 看 看 带 后 递增 的 地 址 寄存 器 间接 寻 址 模式 的 使 用 。 下 面 的 例 
子 使 用 带 后 递增 的 地 址 寄存 器 间接 寻 址 模式 将 存储 在 连续 存储 位 置 的 5 个 数字 加 在 了 一 起 。 请 
注意 指令 LEA (装载 有 效 地 址 ) 的 使 用 ， 这 条 指令 是 专门 为 将 一 个 地 址 放 入 地 址 寄存 器 而 设 
计 的 。 程 序 将 存储 在 存储 器 中 的 5 个 字 节 的 数值 相 加 。 


例子 
ORG $400 
MOVE .B #5, DO *5 个 数字 相 可 
LEA Table,A0 ”*A0 指 向 数字 
CLR.B D1 * 清 空 和 
Loop ADD.B (AO0)+,D1 :股息 短 环 计时 加 数字 到 总 和 
SUB.B #1,D0 * 减 少 循环 
BNE Loop * 直 到 所 有 的 数字 都 被 加 
STOP #$2700 
Table DC.B 1,4,2,6,5 * 一 些 虚 构 的 数据 
END $400 


红 ? 和 术 式 ( 在 挤 作 在 信和 中 歼 但 后 自 加 地址 和 克拉 如 果 相 应 的 操作 分 
别 是 针对 字 节 、 字 或 长 字 的 ， 则 寄存 器 的 值 就 分 别 递增 1 个 、2 个 或 4 个 字 
让 我 们 总 站 一下 主要 的 叶 址 模式 ， 
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“寄存 器 直接 寻 址 用 于 可 以 保存 在 寄存 器 中 的 变量 。 

“文字 (立即 ) 寻 址 用 于 不 可 改变 的 常数 。 它 主要 的 用 途 是 初始 化 变量 。 

。 直 接 (绝对 ) 寻 址 用 于 直接 指定 存储 器 中 变量 的 地 址 。 尽 管 概念 上 简单 ， 但 它 不 允许 程 

序 重 定位 。 

* 地址 寄存 器 间接 寻 址 用 于 当地 址 需要 计算 或 顺序 寻 址 时 。 

。 带 前 递增 或 后 递减 的 地 址 寄存 器 间接 寻 址 用 于 顺序 数据 操作 或 堆栈 的 PUSH 和 POP 操 作 。 

寄存 器 直接 寻 址 和 直接 寻 址 的 唯一 区 别 在 于 前 者 使 用 寄存 器 存储 操作 数 而 后 者 使 用 存储 器 。 

让 我 们 来 看 一 个 简单 的 汇编 语言 程序 ， 访 程序 总 结 了 我 们 刚刚 所 讨论 的 大 多 数 概念 。 假 定 
我 们 有 一 序列 字 节 存储 在 从 标记 为 “data” 位 置 开始 的 连续 存储 位 置 。 图 8-5 是 算法 的 流程 图 。 


2 
心 
ee 


该 程序 在 一 序列 数据 中 寻找 最 大 值 


初始 化 指针 和 累 程序 中 有 两 个 条 件 测试 
加 寄存 器 
得 到 数据 字 节 







是 
用 新 字 节 代替 
扯 字 布 






图 8-5 寻找 一 序列 数据 中 的 最 大 值 且 NULL 字 节 必 须 出 现 的 一 个 算法 的 流程 图 


在 该 程序 中 , 我 们 假设 字 节 串 以 一 个 包含 00 的 字 节 结束 , 我 们 将 称 这 个 字 节 为 NULL 字 节 ， 
这 与 C 语 言 中 字符 串 的 结束 方式 是 一 样 的 。 程 序 允 许 存储 器 中 有 长 度 为 0 的 数字 串 ， 但 是 
NULL 字 节 必 须 出 现 。 

程序 如 下 : 


窒 容 南座 突 机 安 窑 内 浴 守 寥 凋 凋 南 商 凋 商 资 寥 调 守 安 沿 容 窑 寥 容 雇 实 资 潜 安 窒 窃 般 洗 窒 突 责 南 容 安 南 容 次 灾 二 安安 志 声 商 兴 内 实 凋 青 容 寥 寥 商 次 有 窒 守 宙 兴 南 寥 寥 定 翰 十 调调 有 容 容 吉 容 出 二 二 


* 在 字 节 数组 中 寻找 最 大 值 的 程序 
* 数组 从 存储 位 置 $1000 开 始 并 以 一 个 NULL 字 节 ($00) 结束 


帘 突 雪 认 让座 六 醒 认 妆 妆 败 肖 安 安 实 实 安 突 闪 宙 究 究 凋 志 凋 富家 站 全 窑 究 闪光 容 尖 究 沈 当 实 安安 容 宙 妆容 宙 宙 安 安 灾 容 站 诊 站 前 认 家 六 闪 妆 斌 突 当 洛 汪 汪汪 汪 闪 妆容 突 尖 汉 曾 沉 涡 碳 实 当 业 沁 


1 start oRG $400 * 程序 开始 处 
2 LEA data, A0 * 使 用 A0 作 为 一 个 指针 
3 CLR.B D0 * D0 将 保存 最 大 的 字 节 ， 将 它 清 零 
4 next MOVE.B (A0)+,D1 * 循环 ， 读 取 一 个 字 节 
[208 5 Bz9 exit * 是 不 是 NULL 字 节 ? 
6 CHP.B DO,D1 * D1-D0， 看 是 否 新 > 旧 
7 BLE end test 
8 MOVE.B D1,D0 * ; 伏 局 昌 寺 
9 end test BRA next 回 产 让 得了 一 个 字 节 
10 exit STOP #$2700 * A 
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12 ORG $1000 * 数据 区 域 
13 data DC.B 12,13,5,6,4,8,4,10,0 * 样本 数据 
14 END $400 * 程序 终止 和 入 口 


让 我 们 来 分 析 这 个 程序 。 注 意 最 左 列 中 的 数字 在 实际 程序 中 是 不 应 该 有 的 ， 加 入 它们 只 
是 用 来 帮助 识别 每 一 行 指 令 。 还 要 注意 实际 程序 代码 前 星 号 括 起 来 的 一 块 ， 这 是 用 来 描述 算 
法 的 ， 与 C++ 函数 前 的 注释 块 差不多 。 

1. ORG 伪 指令 指定 程序 的 开始 。 

2. LEA (装载 有 效 地 址 ) 用 数据 的 存储 地 址 初始 化 地 址 寄存 器 A0。 实 质 上 ， 我 们 是 将 一 
个 指针 赋值 给 数组 变量 data。 我 们 将 把 指针 保存 在 A0 寄 存 器 。 在 前 面 一 个 代码 片段 中 我 们 使 
用 MOVEA 代 杰 LEA 将 一 个 值 载 入 了 地 址 寄存 器 。 如 果 你 是 为 以 后 使 用 而 装载 一 个 地 址 寄存 器 ， 
那么 LEA 是 首选 的 指令 。 

3. CLR.B 被 用 来 清 零 寄存 器 DO 的 内 容 ， 使 得 我 们 可 以 正确 地 测试 一 个 更 大 的 数 。 而 且 ， 
老 遇 到 数组 长 度 为 0， 我 们 不 会 报告 一 个 错误 的 值 。 

4. MOVE.B 将 A0 所 指 的 字 节 拷贝 到 寄存 器 D1。 由 于 我 们 使 用 的 是 带 后 递增 的 寄存 器 间接 
寻 址 模式 ， 所 以 当 数 据 被 取 回 之 后 ，A0 的 内 容 自 动 递增 ， 指 向 字符 串 中 的 下 一 个 字 节 。 

5. BEQ 进 行 测 试 ， 看 我 们 取 回 的 字 节 是 不 是 NULL 字 节 。 如 果 是 ， 就 进行 转移 ， 转 向 程序 
的 出 口 。 如 果 测 试 失败 ， 则 向 后 执行 下 一 条 指令 。 

6. CMP.B 检 查 新 字 节 是 否 大 于 当前 的 最 大 字 节 。 

7. BLE 执 行 前 面 CMP.B 指 令 的 结果 。 如 果 新 字 节 不 大 于 DO 中 的 当前 字 节 ， 它 就 跳 过 下 一 
条 指令 返回 到 循环 的 开始 处 。 如 果 大 于 ， 则 执行 下 一 条 指令 。 注 意 行 6 和 行 7 是 怎样 配对 成 一 
条 指令 的 ， 该 指令 用 一 条 指令 比较 两 个 值 并 根据 比较 结果 进行 转移 。 

8. MOVE.B 用 新 的 最 大 值 来 代替 D0 中 的 值 。 

9. BRA 总 是 返回 到 循环 的 开始 处 。 

10. STOP 将 我 们 带 回 到 模拟 器 。 

11. ORG 将 重 定位 指令 计数 器 ， 在 地 址 $1000 及 其 以 上 部 分 载 人 汇编 代码 。 

12. DC.B 是 将 样本 数据 载 人 到 标号 “data” 定 义 的 存储 位 置 的 伪 操 作 代 码 。 

13. END 告 诉 汇编 器 停止 汇编 并 装载 程序 从 $400 处 开始 运行 。 


8.2 汇编 语言 和 C++ 


直到 现在 ,我 们 都 是 孤立 地 看 待 汇编 语言 ， 就 像 我 们 在 学 习 一 种 新 的 神秘 的 编程 语言 一 
样 ， 这 么 说 是 有 几 分 道理 的 。 然 而 ， 别 记 了 实际 上 很 多 高 级 语言 的 编译 器 都 输出 汇编 语言 ， 
然后 这 些 编译 器 的 汇编 语言 输出 被 汇编 成 目标 代码 。 这 意味 着 我 们 在 其 他 编程 语言 课程 中 学 
习 过 的 编码 结构 也 必须 翻译 成 相对 应 的 汇编 语言 结构 。 

C 和 C++ 已 有 用 于 改变 程序 流程 的 内 置 结构 。IF/ELSE WHILE DO/WHILE SWITCH 
FOR 以 及 函数 调用 都 可 以 改变 程序 的 流程 。 在 汇编 语言 中 ， 我 们 必须 使 用 有 效 的 汇编 语言 指 
令 来 建立 我 们 自己 的 结构 ， 这 些 有 效 的 汇编 指令 为 转移 (Branch)、 跳 转 (Jump)、 跳 转 到 
子 程序 (Subroutine， 函 数 调用 )。 

当 我 们 考察 编译 器 是 怎样 处 理 一 些 非 常熟 悉 的 C++ 结构 时 ， 我 们 就 会 看 到 这 些 结构 仍然 存 
在 于 汇编 语言 中 。 首 先 回顾 可 知 ， 汇 编 语言 的 比较 指令 (CMP CMPI 和 CMPA) 为 了 设置 正 
确 的 条 件 代码 标志 而 将 两 个 操作 数 相 减 ， 但 并 不 保存 结果 。 因 此 ， 如 果 <D0> = 10 且 <D1> = 
10， 那 么 指令 : 

CMP.B pO, D1 
将 从 数据 寄存 器 D0 的 内 容 中 减 去 数据 寄存 器 D1 的 内 容 。 由 于 这 两 个 寄存 器 都 包含 数字 10， 所 
以 这 个 减法 的 结果 等 于 0， 伴 随 的 结果 是 Z = 1。 然 而 ， 与 实际 的 减法 指令 不 同 ， 


SUB.B D0, D1 
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通过 这 个 比较 操作 ，D0O 和 D1 的 内 容 并 不 改变 。 让 我 们 比较 两 个 代码 片段 。 第 一 个 是 如 下 
所 示 的 C++ 的 一 个 简单 的 下 结构 : 


int a= 3, b= 5; 
if( a == b) 
{ 执行 该 代码 }; 


ee, 执行 该 代码 }; 
编译 器 可 能 会 将 该 程序 转换 为 如 下 的 汇编 语言 代 友 片段: 


MOVE.L #3, DO 
MOVE.L 普 5。 D1 
CMP 


Q 

not_equal { 执行 该 代码 } 

equal { 执行 该 代码 } 

汇编 语言 中 的 循环 结构 与 C++ 循环 结构 相似 。 详 细 地 学 习 这 些 循 环 结构 是 有 益 的 ， 因 为 循 
环 结 构 是 较 难 的 几 种 汇编 语言 代码 结构 之 一 。 让 我 们 来 看 一 个 简单 的 FOR 循环 结构 ， 


for ( int counter = 1 counter < 10 }; counter++ ) 


{ 执行 这 些 语句 } 


MOVE.L #1,D0 * D0 是 计数 器 
MOVE.L #10,D1 | * D1 保存 终止 值 
for loop CMP.B D0O,D1 * 执行 测试 
BEQ next_code * 我 们 已 经 完成 了 吗 ? 
{ 执行 另外 一 些 循环 指令 } * 递增 计数 器 
ADDQ.B #1, D0 
oop * 返回 


BRA for_1 
next_code.{ 执行 循环 后 的 指令 } 


DO/WHILE 结 构 在 C++ 中 的 使 用 也 很 普遍 。 指 令 的 形式 是 ， 
DO 
{ 执行 这 些 语句 } 
WHILE ( 测试 条 件 为 真 ) 
谍 编 语 言 的 类 似 结构 如 下 所 示 : 


MOVEA.W #start addr,A2 * 初始 化 循环 条 件 


test_loop JSR subroutine * 这 是 C++ 中 的 一 次 函数 调用 
CHMPI.B #test_value, (A2)+ * 比较 新 值 
BNE test_loop * 测试 条 件 仍然 为 真 
{ 后 续 的 指令 集合 } * 循环 后 的 代码 


注意 函数 调用 JSR subroutine 至 少 发 生 一 次 ， 因 为 这 是 一 个 DO/WHILE 循 环 结 构 。 指 令 
CMPI.B #test_value, (A2)+ 
是 这 个 相等 测试 的 核心 。 这 里 的 值 test_value 与 地 址 寄存 器 A2 所 指 存储 位 置 处 的 值 进行 比较 。 
指令 执行 后 ， 寄 存 器 A2 的 值 自动 递增 以 指向 下 一 个 存储 地 址 。 因 此 ， 自 动 递增 存储 指针 A2 就 
为 我 们 提供 了 再 次 进入 循环 后 用 来 测试 的 下 一 个 值 。 

让 我 们 在 汇编 语言 算法 的 分 析 上 再 多 做 一 次 练习 。 在 这 个 例子 中 ， 我 们 将 使 用 一 个 非常 
简单 的 汇编 语言 代码 例子 并 不 断 改 进 它 使 之 尽 可 能 高 效 。 在 这 个 例子 中 ， 高 效 性 将 通过 代码 
紧凑 性 和 执行 速度 来 衡量 。 下 面 是 问题 的 陈述 : 

将 数据 值 $FF 写 入 从 $1000 到 $1005 的 存储 地 址 处 ， 包 括 $1000 和 $1005。 

例 ] 变 力 法 
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宙 宽 实 宣 二 二 实 窒 窒 窒 守 南 站 直 帘 二 出 容 容 宙 翰 二 二 二 省 宽 寓 次 守 再 下 颠 家 过 鹤 丙 宙 调 容 训 友 页 由 雇 突 寥寥 实 识 容 坟 遍 汶 二 出 出 安 完 宾 宽 席 席 


* 该 程序 将 FF 存 信 $1000 到 $1005 的 存储 地 址 


淫 规 帘 册 帘 容 究 盖 二 贞 认 雪 闪 家 实 家 安 册 守 诊 突 窒 肖 内 内 家 家 二 汪汪 次 汪 容 交 帘 六 室 六 实 妇 家 交 实 灾 认 祖上 兴 内 宙 雪 安 帘 突 容 内 突 内 宙 宙 究 内 闪 


* 系统 的 等 于 伪 指 令 


load val EQU $FF * 要 存储 的 字 节 
pgm start EQU $400 * 程序 从 这 里 开始 运行 
stack EQU $2000 * 把 堆栈 放 在 这 里 
ORG pgm start 
LEA stack, SP * 初始 化 栈 指针 
MOVE.B ”#Load_val1,$1000 * 存储 第 一 个 值 
MOVE.B #1load val,$1001 * 存储 第 二 个 值 
MOVE.B #1load val,$1002 * 存储 第 三 个 值 
MOVE.B #load val,$1003 * 存储 第 四 个 值 
MOVE.B #1load_val,$1004 * 存储 第 五 个 值 
MOVE.B #load_val,$1005 * 存储 第 六 个 值 
STOP #$2700 * 返回 到 模拟 器 
END start * 在 此 处 停止 汇编 
在 我 们 分 析 程序 之 前 ， 我 们 先 看 一 条 比较 奇怪 的 指令 ， 即 指令 : 
LEA stack, SP * 初始 化 栈 指针 


将 定义 为 stack 《存储 位 置 $2000) 的 变量 的 地 址 放 和 人 叫做 SP 的 地 方 。SP 是 汇编 器 指定 寄存 器 
A7 或 A7'( 即 堆栈 指针 ) 的 一 种 方式 。 我 们 将 在 后 面 更 详细 地 讨论 堆栈 指针 。 现 在 我 们 接受 这 
个 信念 ， 就 是 有 必要 将 栈 指针 定位 在 高 存储 位 置 ， 并 且 我 们 应 该 把 它 作为 程序 首先 要 做 的 事 
情 之 一 ， 还 要 注意 我 们 是 使 用 装载 有 效 地 址 (LEA) 指令 来 完成 这 个 任务 的 。 

现在 ， 让 我 们 来 分 析 这 个 程序 。 例 1 中 的 程序 是 可 以 运行 的 ， 但 它 还 远 远 称 不 上 高 效 。 
MOVE.B 指 令 所 有 的 目的 操作 数 都 是 绝对 地 址 。 我 们 在 浪费 指令 的 存储 空间 ， 因 为 我 们 为 每 
次 数据 传送 严格 地 指定 了 存储 地 址 。 假 设 我 们 要 移动 600 000 字 市 而 不 是 6 个 字 节 ， 那 么 很 明 
显 这 个 方案 就 不 可 行 了 。 

我 们 可 以 通过 使 用 一 个 数据 寄存 器 来 保存 移 至 存储 器 的 数据 值 $FF， 还 可 以 使 用 一 个 地 址 
寄存 器 来 指向 我 们 想 要 存储 数据 的 存储 位 置 来 改进 例 1。 这 可 以 为 我 们 节省 时 间 和 空间 ， 因 为 
数据 $FF 现 在 存储 在 寄存 器 中 供 我 们 使 用 ， 而 不 是 每 次 从 存储 器 中 重新 取 回 它 。 缺 点 是 我 们 必 
须 在 初始 化 时 给 一 些 寄存 器 装载 值 ， 这 就 需要 一 些 额外 的 指令 。 不 过 ， 由 于 使 用 短 指令 ， 执 
行 时 间 较 短 ， 装 载 寄 存 器 的 开销 将 被 抵消 一 部 分 。 

例 2 使 用 寄存 器 


育 妆 闪闪 六 闪 突 闪 六 突 寅 寅 内 有 内 商 突 实 流 二 辣 六 认 认 六 闪闪 闪闪 突 交 全 次 实 安安 业 炳 疫病 闪 站 六 认 商 汪 容 六 闪闪 汪 雪 商 让 二 灾 和 妆 灾 宙 窑 内 


* 该 程序 将 FF 存 和 $1000 到 $1005 的 存储 地 址 


实 突 突 家 闪 娄 妆 妆 妆 灾 灾 室 突 实 灾 突 内 灾 内 闪 风灾 究 关 闪 宙 肖 肖 肖 肖 安帝 内因 次 衣 认 六 闪 灾 突 富 窒 赤 六 灾 雪 实 妆 闪闪 突 容 兴 突 次 交 闹 二 室 窒 究 


* 系统 的 等 于 伪 指 令 


load val EQU $FF * 将 要 存储 的 字 节 
pgm start EQU $400 * 程序 从 这 里 开始 运行 
stack EQU $2000 * 把 堆栈 放 在 这 里 
start_addar EQU $1000 * 存储 的 首 地 址 
* 程序 从 这 里 开始 
ORG PIm start 
LEA stack, SP * 初始 化 栈 指针 
LEA Start_addr,A0 * 设置 A0 为 栈 指针 
MOVE.B #1load val,D0 * 将 它 放 人 到 数据 寄存 器 中 
MOVE.B D0,(A0) * 存储 第 一 个 值 
ADDA.W #01,A0 * 指向 下 一 个 地 址 
MovE .B D0, (A0) * 存储 第 二 个 值 
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ADDA.W #01, AO * 指 向 下 一 个 地 址 
MOVE.B D0O, (A0) * 存 储 第 二 个 值 
RDDR.W #01, AO * 指 向 下 一 个 地 址 
MOVE.B D0O, (A0) * 存 储 第 三 个 值 
ADDA.W #01, AO * 指 向 下 一 个 地 址 
MOVE.B DO, (AO0) * 存 储 第 四 个 值 
ADDA.W #01, AO * 指 向 下 一 个 地 址 
MOVE.B DO, (A0) * 存 储 最 后 一 个 值 
STOP #$2700 * 返 回 到 模拟 器 
END pgm start * 停 止 汇 编 


这 个 方案 更 好 ， 因 为 移动 数据 的 每 条 指令 只 取决 于 寄存 器 的 内 容 。 我 们 能 否 做 得 更 好 
呢 ? 是 的 ， 我 们 可 以 通过 使 用 自动 递增 寻 址 模式 (官方 称 为 带 后 递增 的 地 址 寄存 器 间接 寻 址 
模式 ) 来 删 掉 指 令 : 


RDDR .W #01, AO 
例 3 自动 递增 


窒 窒 内 误诊 肖 妆容 挛 突 闪闪 安 宙 内容 实 央 次 灾 灾 突 闪 内 突 灾 安 当 容 突 沉 安 兴 认 突 安 容 闪闪 内 内 闪闪 肖 当 年 闪 内 迪 二 突 突 次 二 宙 妆容 妆 宙 内 内 


* 该 程序 将 FF 存 信 $1000 到 $1005 的 存储 地 址 


突 实 安 赤 育 兴 妆容 二 商 容 内 当 六 妆容 安 请 突 灾 内 妆 灾 突 安 发 交 突 灾 内 内 实 突 实 安 内 闪闪 当当 内 容 灾 安 闪 闪 突 购 商 认 究 内 灾 灾 内 二 站 窑 央 兴 向 


* 系统 的 等 于 伪 指 令 


load val EQU $FF * 将 要 存储 的 字 节 

pgm start EQU $400 * 程序 从 这 里 开始 运行 

stack EQU $2000 * 把 堆栈 放 在 这 里 

start_ addr EQU $1000 * 存储 的 首 地 址 

* 程序 从 这 里 开始 
ORG pgm start 
LEA Stack SP - * 初始 化 栈 指针 
LEA start_addr,A0 * 设置 A0 为 指针 
MOVE .B #1oaa_val,D0 * 将 它 放 入 数据 寄存 器 
MOVE .B D0,，(AO)+ * 存储 第 一 个 值 并 递增 
MOVE .B DO, (AO)+ * 存储 第 二 个 值 并 递增 
MOVE .B D0, (A0)+ * 存储 第 三 个 值 并 递增 
MOVE.B DO, (A0)+ * 存储 第 四 个 值 并 递增 
MOVE.B DO, (A0)+ * 存储 第 五 个 值 并 递增 
MOVE .B D0, (A0) * 存储 最 后 一 个 值 
STOP #$2700 * 返回 到 模拟 器 
END pgm start * 在 此 处 停止 汇编 


例 3 是 否 已 经 做 到 最 好 了 呢 ? 这 是 一 个 值得 深入 分 析 的 有 趣 问 题 。 为 什么 呢 ? 因为 对 于 一 . 
个 具有 6 条 数据 写 语 句 的 简单 程序 ， 试 图 用 循环 结构 来 使 代码 更 加 紧凑 可 能 实际 上 会 降低 而 不 
是 提高 性 能 。 但 是 ， 如 果 我 们 正在 移动 的 是 很 多 数据 ， 那 么 很 明显 这 个 内 联 算法 将 不 能 运行 。 

从 计算 机 性 能 的 角度 来 看 ， 关 于 内 联 算法 与 循环 结构 的 对 比 问题 是 非常 有 趣 的 。 当 计算 
机 能 够 执行 大 块 的 内 联 代码 且 不 需要 进行 转移 或 循环 时 ， 计 算 机 的 效率 是 最 高 的 。 编 译 器 党 
常 将 for 循 环 转换 为 内 联 代码 (如果 返 代 的 数字 在 可 处 理 的 范围 内 ) 以 提高 性 能 。 在 后 面 有 一 
课 中 讨论 流水 线 时 ， 我 们 就 会 明白 其 中 的 原因 。 

上 总之， 让 我 们 插入 一 个 循环 结构 来 看 看 是 否 提 高 了 效率 。 

例 4 DO/WHILE 循 环 结构 


安安 安安 妆容 突 突 当家 宣 交 究 帘 灾 突 宙 灾 容 究 办 灾 突 有 妆 窒 容 安 守 安 次 富商 帘 向 安 闪 二 二 突 实 突 交 二 妆 闪 实 安帝 宙 当 次 奖 实 灾 内 安安 业 闪 央 内 


* 该 程序 将 FF 存 人 $1000 到 $1005 的 存储 地 址 


家 家 宙 宙 六 闪闪 妆 突 安 站 安 灾 闪闪 实 内 闪闪 妆 窑 突 诊 突 窑 突 实 次 闪闪 突 灾 安帝 疹 认 突 突 家 妆 福 实 宙 安家 内 六 容 容 突 安 兴安 认 内 闪闪 安 妆 次 实 向 


* 系统 的 等 于 伪 指 令 
load val EQU $FF * 将 要 存储 的 字 节 





汇编 三 言 程序 嫩 矿 779 


pgm_start EQU $400 * 程序 从 这 里 开始 运行 
stack EQU $2000 * 把 堆栈 放 在 这 里 
start_adar EQU $1000 * 存储 的 首 地 址 
end_addr EQU $1005 * 存储 的 最 后 地 址 
ORG pgm start 
LEA stack, SP * 初始 化 栈 指 针 
LEA start_addr,A0 * 设置 A0 为 指针 
LEA end_addr,Al  * Al 将 保存 终点 
MOVE.B #1loaG val,D0 * 将 它 放 入 数据 寄存 器 
loop MOVE .B DO, (AO0)+ * 存储 值 并 递增 
CMPA.W A1l,AO * 是 否 已 完成 ? 
BLE loop * 没有 完成 ， 跳 回 
STOP #$2700 * 返回 模拟 器 
END pgm_start * 在 此 处 停止 编译 


我 们 已 经 设法 将 算法 的 实际 指令 从 10 条 减少 到 了 8 条 (不计 伪 代 码 )。 这 虽然 更 好 ， 但 是 对 于 
这 个 简单 算法 来 说 ， 循 环 的 价值 被 创建 它 的 费用 所 掩盖 了 。 然 而 ， 如 果 循 环 要 执行 大 约 1 000 000 
次 左右 ， 那 么 将 算法 写成 内 联 代 码 是 不 可 能 的 。 让 我 们 来 看 看 这 个 带 有 for 循 环 结构 的 算法 。 

例 5 jor 循 环 结 构 


生病 安 当 突 妆 闪 妆 家 认为 办 闪闪 妆容 妆 实 内 认 当 妆容 妆 突 帘 妆 富 认 闪闪 突 妆 安 病 二 二 寅 次 妆 业 站 二 妆 妆 克 妆 病 师 站 宙 安 宙 实 实 实 实 实 认 突 突 内 


* 该 程序 将 FF 存 人 $1000 到 $1005 的 存储 地 址 


究 家 认 尖 滑 贞 安 闪 二 次 妆 妆 帘 妆 交 究 六 二 窑 宙 室 安 业 业 认 突 二 室 实 灾 突 实 灾 突 实 突 窑 突 突 突 容 突 实 次 突 究 究 实 究 湖 突 究 内 闪闪 二 妆 宙 位 削 病 宙 


* 系统 的 等 于 伪 指 令 


load val EQU $FF * 将 要 存储 的 字 节 
pgm start EQU $400 * 程序 从 这 里 开始 运行 
stack EQU $2000 * 把 堆栈 放 在 这 里 
start_addr EQU $1000 * 存储 的 首 地 址 
loop ctr EQU 6 * 循环 的 次 数 
ORG pgm start 
LEA stack, SP * 初始 化 栈 指针 
LEA start_addr,A0 * 设置 A0 为 指针 
MOVE.B #loop_ctr,D1 * D1 将 保持 跟踪 
MOVE .B #1oad_val,D0 * 将 它 放 入 数据 寄存 器 
loop MOVE.B DO, (A0)+ * 存储 值 并 递增 
SUBQ.B #01, D1 * 递减 计数 器 
BNE loop * 是 否 已 完成 ? 
STOP #$2700 * 返回 模拟 器 
END pgm_start * 在 此 处 停止 编译 


计数 指令 告诉 我 们 ，for 循 环 结构 和 do/while 循 环 结构 给 出 了 相同 的 结果 。 但 是 ， 为 了 真正 
知道 是 否 一 种 方法 比 另 一 种 更 好 ， 我 们 需要 仔细 看 看 每 条 指令 并 计算 实际 需要 的 时 钟 周期 数 。 
也 只 有 这 时 候 我 们 才能 够 知道 到 底 for 循 环比 do/while 更 高 效 还 是 更 低 效 。 

此 时 我 们 可 以 说 的 就 是 我 们 已 经 做 得 足够 好 了 。 我 们 还 能 做 得 更 好 吗 ? 可 以 ， 但 如 何 做 
得 更 好 并 不 是 显而易见 的 。 答 案 在 于 需要 使 用 一 条 更 复杂 的 指令 一 -DBcc 指 令 。 请 参考 
Meotorola 程 序 员 参 考 手册 中 关于 该 指令 的 完整 讨论 。 这 是 一 条 很 难 掌握 的 指令 ， 但 是 它 将 下 
面 两 条 指令 组 合成 了 一 条 指令 : 

SUBQ.B #01,D1 * 计数 器 递减 

BNE loop * 是 否 已 完成 ? 

通过 使 用 BDcc 指 令 我 们 可 以 使 程序 更 加 紧凑 。 

例 6 ”使 用 DBcc 指 邻 
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实 突 实 容 家 穴内 肖 突 容 实 突 灾 帘 容 闪闪 宙 滑 闪 认 六 实 宙 当 帘 深 窑 安安 安室 究 沿 内 帘 业 当 六 灾 六 宙 寅 突 妆 宙 突 闪闪 二 妆 实 容 诡 闪闪 妆 妆 妆 宙 究 内 


* 该 程序 将 FF 存 人 $1000 到 $1005 的 存储 地 址 


实 帘 灾 突 实 灾 寅 富 突 帘 帝 宙 汪 突 交 妆 安 安安 容 安 交 雪 当 滑 内 内 突 突 内 突 滑 实 实 闪闪 实 灾 商 济 突 渍 实 兴 闪 交 次 六 实 宙 安 宙 灾 宙 闪 妆 突 安 内 闪闪 


* 系统 的 等 于 伪 指 令 


load val EQU $FF * 将 要 存储 的 字 节 
pgm_start EQU $400 * 程序 从 这 里 开始 运行 
stack EQU $2000 * 把 堆栈 放 在 这 里 
start addr EQU $1000 * 存储 的 首 地 址 
loop_ctr EQU 5 * 循环 的 次 数 
ORG pgm start 
LEA stack, SP * 初始 化 栈 指针 
LEA start_addr,A0 * 设置 A0 为 指针 
MOVE .B #1loop_ctr,D1 * D1 将 保持 跟踪 
MOVE.B #1load val,DO  * 将 它 放 入 数据 寄存 器 
loop MOVE .B D0, (AO)+ * 存储 值 并 递增 
DBF D1, loop * 循环 计数 器 递减 ， 如 果 D1! = -1 则 转移 
STOP #$2700 * 返回 模拟 器 
END pgm_start * 在 此 处 停止 编译 - 


这 段 程序 也 许 如 其 所 达到 的 那么 好 。DBF 指 令 是 非常 复杂 且 非 常 难 掌握 的 指令 ， 但 是 一 旦 
你 掌握 了 它 ， 你 就 可 以 把 它 加 到 你 的 工具 箱 ， 当 需要 节省 一 两 个 时 钟 周期 的 时 候 你 就 可 以 使 
用 它 。 该 指令 是 这 样 运行 的 : 首先 ， 它 要 么 测试 条 件 码 标志 (DBcc), 要 么 被 迫 总 为 假 (DBF)。 
每 次 通过 循环 ， 如 果 条 件 为 假 ， 数 据 寄存 器 (这 里 指 D1) 就 递减 。 循 环 在 两 种 情况 下 退出 : 

1. 条 件 为 真 ， 

2. 数据 寄 存 器 的 值 = 一 1。 

因此 ， 指 令 DBF D1， loop 保 证 转移 返回 “loop” 并 递减 D1 直到 <D1> = -1， 然 后 退出 
循环 。 由 于 我 们 使 用 的 总 是 测试 为 假 的 指令 形式 ， 所 以 我 们 总 是 转移 返回 。 

让 我 们 来 复习 一 下 我 们 刚刚 所 学 的 东西 。 在 这 一 系列 中 ， 我 们 从 一 个 非常 简单 明了 的 方 
案 ( 取 到 数据 并 把 它 放 在 这 里 ) 一 直 走 到 了 一 个 非常 紧 姿 一流 的 方案 。 在 这 个 过 程 中 ， 我 们 
从 简单 指令 和 寻 址 模式 走 到 了 更 加 复杂 的 指令 、 寻 址 模式 和 算法 结构 。 为 了 使 程序 尽 可 能 紧 
次 ,我们 使 用 了 一 条 相当 复杂 的 指令 DBF 来 组 合 寄存 器 递减 操作 和 测试 转移 操作 。 下 面 的 表 
格 显示 了 前 面 使 用 的 各 种 指令 的 时 钟 周 期 数 和 执行 时 间 (假定 为 16MHz 的 时 钟 频 率 )。 





指 令 时 钟 周期 指令 执行 时 间 〈 微 秒 ) 
MOVE .B #$FF, $1000 28 1.75 
MOVE.B DO, $1000 : 20 1.25 
ADDA.W #01, AO 12 0.75 
MOVE.B DO, (A0) 8 0.5 
MOVE.B DO, (A0)+ 8 0.5 


将 字 节 值 SFF 移 动 到 每 个 存储 位 置 所 需 的 时 钟 周期 数 有 一 个 3.5 的 因数 ， 该 因数 取决 于 数 
据 每 次 是 从 存储 器 装载 并 写 回 特定 存储 位 置 还 是 使 用 数据 和 地 址 寄存 器 来 存储 和 操作 该 值 。 


8.3 堆栈 和 子 程序 


堆栈 的 概念 是 计算 机 管理 其 数据 和 地 址 的 基础 。 堆 栈 是 后 进 先 出 (LIFO) 数据 结构 的 一 
个 实例 。 在 68K 体 系 结构 中 ， 有 两 个 专用 寄存 器 A7 和 A7 ’， 它 们 是 专用 于 堆栈 操作 的 。A7 是 
用 户 堆 栈 指针 《user stack pointer) ， 在 汇编 语言 指令 中 它 一 般 被 称 为 SP 而 不 是 A7，A7 是 管 
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理 堆 栈 指 针 (supervisor stack pointer)。 

实际 上 ， 管 理 堆栈 指针 与 管理 模式 (Supervisor mode) 下 的 一 系列 专用 指令 一 起 都 是 保 
留 给 操作 系统 使 用 的 。 通 常 ， 我 们 的 程序 运行 在 比 操作 系统 低 的 优先 级 。 我 们 在 用 户 模式 
(user mode) 下 运行 程序 ， 并 自动 访问 A7 寄 存 器 作为 堆栈 指针 而 不 是 管理 堆栈 指针 。 但 是 ， 
由 于 我 们 运行 在 模拟 器 上 的 程序 十 分 简单 ， 并 不 要 求 使 用 操作 系统 (除了 你 的 PC 操作 系统 )， 
所 以 我 们 就 总 是 运行 在 管理 模式 下 并 使 用 管理 堆栈 指针 进行 操作 。 管 理 模 式 和 用 户 模式 都 称 
栈 指针 为 SP， 你 会 得 到 哪个 堆栈 指针 取决 于 你 处 于 哪个 模式 下 。 图 8-6 总 结 了 堆栈 的 操作 。 


维 本 指针 SP(A7) 的 初始 人 为 术 项 Sa 





$FFFFFF 
$FFFFFE 
$FFFFFD 
$FFFFFC 
$FFFFFB 





PusH 吉 作 过 和 中 堆 机 向 


机 人 


POP 操作 过 程 中 ， 堆栈 向 
让 ' 


MOVE.B (SP)+ DO 
eh 


和 全 伯 汪 向 当 人身 尖 人 自身 属 





图 8-6 68000 堆 栈 指针 寄存 器 A7 的 操作 


前 递减 寻 址 模式 和 后 递增 寻 址 模式 的 原因 现在 已 经 显而易见 了 。 堆 栈 指针 总 是 指向 栈 顶 
的 存储 地 址 。 当 其 他 数据 需要 放 和 人 存储 器 时 ， 指 针 必 须 先 递减 以 指向 下 一 个 有 效 地 址 ， 从 而 
保证 当 发 生 数据 存储 时 ， 数 据 移 至 空闲 存储 位 置 。 后 递增 模式 访问 堆栈 中 的 当前 存储 地 址 然 
后 再 递增 ， 所 以 SP 指向 栈 中 存储 位 置 的 前 一 项 。 

现在 我 们 已 经 说 明了 堆栈 是 怎样 实现 LIFO 数 据 结构 的 ， 接 下 来 我 们 将 转向 子 程序 的 学 习 。 
汇编 语言 中 简单 明了 的 子 程序 与 C 语 言 中 的 函数 调用 等 价 。 当 程序 碰 到 跳 转 到 子 程序 (JSR ) 
指令 时 ， 处 理 器 会 自动 将 下 一 条 指令 的 长 字 地 址 压 入 栈 中 ， 然 后 再 跳 转 到 操作 数 所 指定 的 位 
置 。 由 于 程序 计数 器 总 是 指向 待 取 的 下 一 条 指令 ， 所 以 JSR 指 令 的 作用 就 是 首先 将 程序 计数 器 
的 内 容 移 至 栈 指针 所 指 的 当前 位 置 ， 然 后 用 新 的 操作 数 地 址 装载 程序 计数 器 。 这 可 以 有 效 地 
使 得 程序 “ 跳 转 ”到 存储 器 中 的 新 位 置 。 

从 子 程 序 返 回 〈(RTS) 的 指令 被 放 在 子 程序 的 最 后 。 它 使 得 堆栈 将 返回 地 址 退回 给 PC， 
下 一 条 指令 从 程序 跳 转 到 子 程序 的 地 方 开始 执行 

当 你 用 C 或 C++ 编写 程序 时 ， 编 译 器 将 管理 过 程 调用 或 函数 调用 时 的 所 有 常规 事务 。 在 汇 
编 语言 中 ， 程 序 员 应 该 

。 保 证 所 有 后 来 的 压 栈 和 退 栈 操作 成 对 出 现 。 

。 保 证 子 程序 用 到 的 所 有 资源 (寄存 器 和 存储 器 ) 在 子 程序 使 用 它们 之 前 要 正确 保存 下 

来 ， 在 子 程序 返回 时 又 要 将 它们 恢复 。 
。 决 定 在 子 程序 和 主 程序 之 间 进 行 参数 传递 的 一 种 机 制 。 
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通常 ， 一 个 子 程序 很 可 能 需要 用 到 主 程序 或 另 一 个 子 程序 正在 使 用 的 寄存 器 资源 。68K 处 
理 器 有 一 套用 来 管理 这 个 的 机 制 。MOVEM 指 令 就 是 用 来 快速 指定 那些 在 进入 子 程序 时 需要 保 
存在 栈 中 且 从 子 程序 退出 时 又 要 恢复 的 一 系列 寄存 器 。 通 过 在 入 口 处 将 子 程序 中 将 要 用 到 的 
寄存 器 保存 下 来 然后 在 退出 之 前 恢复 它们 ， 子 程序 就 可 以 自由 地 使 用 这 些 寄存 器 而 不 会 破坏 
正 被 其 他 过 程 使 用 的 数据 。 因 此 ， 在 进入 子 程序 时 通常 没有 必要 保存 所 有 的 寄存 器 ， 当 然 若 
全 保存 也 没有 什么 害处 。 一 旦 你 决定 了 哪些 寄存 器 不 会 在 你 的 子 程序 中 用 到 ， 你 就 可 以 简化 
代码 了 。 还 有 ， 就 像 在 C 语 言 中 一 样 你 可 能 需要 将 参数 传 进 传 出 子 程序 ， 但 是 ， 决 定 怎样 来 完 
成 参数 的 传 进 传 出 是 你 的 任务 ， 因 为 没有 编译 器 会 为 你 提供 一 套 规则 。 

因此 ， 在 子 程序 的 入 口 ， 使 用 


MOVEM < 寄存 器 列表 >，- (SP) 
就 可 以 将 寄存 器 压 入 栈 中 ， 而 在 子 程序 的 出 口 ， 使 用 
MOVEM (SP)+， < 寄存 器 列表 > 


就 可 以 将 寄存 器 从 栈 中 退出 。 

值得 告诫 的 是 : 使 用 寄存 器 将 参数 传人 一 个 子 程序 和 使 用 寄存 器 从 子 程序 返回 结果 是 非 
常 方便 的 。C/C++ 的 关键 字 return 通 常会 使 编译 器 将 函数 调用 的 结果 放 入 指定 寄存 器 然后 再 从 
子 程序 返回 。 如 果 你 想 要 将 一 个 寄存 器 中 的 结果 返回 ， 那 么 你 最 好 别 用 那个 特定 的 寄存 器 来 
完成 子 程序 入口 处 的 保存 和 出 口 处 的 恢复 操作 。 为 什么 呢 ? 因为 当 你 在 子 程序 出 口 恢复 寄存 
器 时 你 会 把 要 返回 的 结果 覆盖 掉 。 很 多 学 生 曾经 花费 了 大 半夜 的 时 间 来 查找 这 个 特别 的 错误 。 

通过 使 用 REG 这 条 汇编 伪 指令 ， 创 建 寄存 器 列表 会 变 得 更 容易 。 它 允许 定义 一 系列 寄存 
器 ， 格 式 是 ; E 

< 标识 符 > REG < 寄存 器 列表 > 

寄存 器 可 以 被 指定 为 单个 的 寄存 器 (A0 或 D0) 、 用 斜 线 分 割 的 列表 ( 即 A1/A5/A7/D1/D3)， 
也 可 以 被 指定 为 寄存 器 范围 (如 A0-A3) 。 举 个 例子 ， 下 面 的 语句 定义 了 一 个 叫做 “save_reg” 
的 寄存 器 列表 


save_reg REG AO0-A3 / RAR5 / DO-D7 
寄存 器 按照 一 种 固定 的 次 序 自动 保存 和 恢复 ，REG 指 令 中 指定 的 范围 没有 明确 规定 其 次 
序 。 请 参考 你 的 程序 员 手 册 以 得 到 MOVEM 指 令 的 一 个 全 面 解释 (尽管 难以 理解 )。 图 8-7 总 结 
了 进入 和 退出 子 程序 时 的 资源 保存 和 恢复 操作 。 
主 程序 


人 


JSR subr1 





图 8-7 子 程序 的 资源 管理 
就 像 C 语 言 中 的 函数 调用 一 样 ， 子 程序 可 能 是 贱 套 的 。 重 要 的 是 牢记 子 程序 需要 谨慎 的 堆 
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栈 管理 ， 因 为 返回 路 径 取决 于 存储 在 堆栈 中 的 正确 的 返回 地 址 序列 。 子 程序 应 该 总 是 返回 到 
它们 被 调用 的 地 方 ， 也 就 是 JSR 指 令 的 下 一 条 指令 。 但 是 ， 跳 转 表 (jump table) 是 这 个 规则 
的 少数 例外 之 一 ， 我 们 将 在 后 面 的 一 课 中 学 习 跳 转 表 。 图 8-8 说 明了 子 程序 的 伐 套 。 

主 程序 






JSR BAR 
RTS 





图 8-8 人 黎 套 子 程序 。RTS 指 令 应 该 总 是 用 来 返回 到 最 近 的 JSR 指 令 后 的 那 条 指令 


子 程序 可 以 使 编码 更 高 效 ， 因 为 相同 的 代码 块 可 以 被 使 用 很 多 次 。 另 一 个 选择 是 所 有 的 
代码 都 用 内 联 方式 编写 。 这 里 是 编写 和 使 用 子 程序 时 的 几 点 指导 方针 : 

1. 在 试图 执行 JSR 指 令 之 前 必须 确立 用 户 栈 。 

2. 将 子 程 序 放 在 程序 主体 部 分 之 后 ， 但 在 数据 存储 区 域 之 前 。 

3. 每 个 子 程 序 应 以 一 个 注释 块 开 头 ， 列 出 : 

a) 子 程 序 名 字 

b) 完成 什么 工作 

c) 使 用 和 保存 的 寄存 器 

d) 输入 和 返回 的 参数 

4. 子 程序 的 第 一 行 必 须 有 带 有 子 程序 名 字 的 标号 。 汇 编 器 正 是 这 样 插入 目的 操作 数 的 有 
效 地 址 的 。 

5. 在 子 程序 的 入 口 保存 将 要 用 到 的 寄存 器 。 

6. 退 出 子 程序 时 恢复 寄存 器 。 

7. 总 是 返回 子 程序 被 调用 的 地 方 。 换 句 话说， 不 要 压 和 人 一 个 新 的 返回 地 址 到 栈 中 ， 也 不 
要 从 子 程序 跳 转 或 转移 到 其 他 地 方 而 将 返回 地 址 留 在 栈 中 。 

8. 子 程序 允许 颈 套 ， 就 像 C 语 言 中 的 函数 调用 一 样 。 


一 个 示例 程序 ， 具体 细节 


我 们 已 经 花费 了 相当 多 的 时 间 来 分 析 主 要 的 寻 址 模式 和 学 习 一 些 编程 概念 ， 现 在 就 可 以 
更 详细 地 看 两 个 例子 了 。 该 程序 将 我 们 到 目前 为 止 所 学 的 所 有 概念 都 放 在 了 里 面 ， 是 一 个 完 
整 的 程序 。 | 

对 于 下 一 个 示例 程序 ， 让 我 们 来 编写 一 个 能 真正 做 点 有 意义 事情 的 程序 。 它 将 检查 系统 
中 存储 器 的 完整 性 。 这 是 一 个 非常 普通 的 程序 ， 在 很 多 计算 机 系统 中 被 广泛 使 用 ， 特 别 是 在 
系统 进行 自 检 时 的 引导 时 间 内 。 每 次 当 你 开机 或 按 下 重启 键 (RESET) 时 PC 都 会 执行 该 程序 。 
我 们 的 计划 是 ， 通 过 一 个 存储 器 测试 程序 示例 来 考察 到 目前 为 止 所 讨论 的 在 实际 程序 中 使 用 


kt 
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的 所 有 知识 点 。 我 们 的 目标 是 ， 

。 研究 汇编 语言 程序 的 结构 ; 

。 了解 怎样 使 用 注释 ， 

*。 了 解 怎样 使 用 等 于 擅 指 令 (EQU) 来 定义 常数 ， 

。 了 解 怎样 使 用 标号 来 定义 存储 位 置 ; 

。 研究 实际 中 怎样 使 用 擅 操 作 指令 (ORG、DS、DC、END)， 

。 了 解 怎样 使 用 装载 有 效 地 址 (LEA) 命令 ; 

。 观察 程序 中 用 到 的 各 种 寻 址 模式 ; 

。 了 解 比较 指令 是 怎样 与 转移 指令 组 合 来 测试 和 更 改 程序 流程 的 ; 

。 观察 子 程序 的 头 模块 ， 

。 了 解 怎样 使 用 子 程序 ， 以 及 参数 是 怎样 传递 的 。 

作为 介绍 的 一 种 方式 ， 让 我 们 讨论 一 下 程序 在 做 什么 。 程序 已 经 被 固定 地 编写 成 总 是 测 
试 从 $2000 到 $6000 的 存储 区 域 ， 尽 管 开 始 地 址 和 结束 地 址 在 一 定 程度 上 是 任意 的 ， 而 且 我 们 
可 以 很 容易 地 通过 “等 于 伪 指 令 ” 改 变 被 测试 的 范围 。 

程序 将 一 个 字 节 值 写 出 到 存储 器 然后 立即 将 它 读 回 ， 读 回 的 值 应 该 与 写 出 的 值 相同 。 
如 果 不 相 同 ， 就 可 能 存在 一 个 坏 的 存储 位 置 ， 或 者 也 可 能 是 断 掉 的 或 短路 了 的 存储 线 。 作 
为 确定 问题 起 因 的 一 种 方法 ， 我 们 使 用 4 个 不 同 的 字 节 值 : $00、$FF、$55 和 $AA， 它 们 分 
别 代表 所 有 的 数据 线 为 低 、 所 有 的 数据 线 为 高 、 偶 数据 线 低 且 奇 数据 线 高 以 及 偶数 据 线 高 
且 奇 数据 线 低 。 我 们 也 可 以 通过 保存 存储 器 测试 中 失败 的 10 个 存储 位 置 来 跟踪 检测 到 的 失 
败 次 数 。 

程序 的 第 一 部 分 包含 了 系统 的 等 于 伪 指 令 ， 可 以 把 这 当 作 头 文件 ， 这 里 是 你 存放 所 有 
#define 语句 的 地 方 。 应 该 注意 的 是 几乎 每 个 常数 或 初始 值 都 在 这 里 被 定义 并 被 给 予 一 个 符号 
名 。 还 要 注意 坏 位置 数 的 最 大 值 maxcnt 被 定义 成 了 一 个 十 进 制 数 ， 因 为 这 样 它 的 含义 会 更 清 
晰 。 汇 编 器 会 将 它 转 换 为 十 六 进 制 的 。 


诊 实 突 妆 妆容 次 容 突 实 突 突 实 实 实 灾 灾 实 商 容 家 容 宁 闪闪 闪 六 入 闪 汪 突 室 突 突 突 交 兴 闪 突 妆 六 六 闪闪 闪 灾 放 闪 办 妆 闪 认 认 认 贞 这 办 六 认 
* 


存储 器 测试 程序 


4 个 测试 码 : 00、S$SFF、S$SRAA、$55 
并 且 它 能 存储 多 至 10 个 的 坏 地 址 位 置 


守 市 市 市 布 沿 沿 光志 帘 克 党 替 沉 光 尘 市 遍 灾 寺 澳 完 守 次 举 举 涯 将 澳 洛 泊 举办 次 次 潜 潜 浴 许 洛 洛 站 次 凌 潜 洛 坟 次 凋谢 次 洛 山 寥 澳 放 高 肌 家 


* 这 是 一 个 用 来 测试 从 字 节 地 址 $2000 到 $6000 处 存储 器 的 程序 。 它 使 用 了 


* 


* 系统 的 等 于 伪 指 令 


end_ test EQU $11 * 测试 向 量 终止 处 
test1 EQU 00 * 第 一 个 测试 码 
test2 EQU $FF * 第 二 个 测试 码 
test3 EQU $55 * 第 三 个 测试 码 
test4 EQU $AA * 第 四 个 测试 码 
st_addr EQU $2000 * 测试 开始 地 址 
end_addr EQU $6000 * 测试 结束 地 址 
stack EQU $7000 * 堆栈 位 置 
maxcnt EQU 10 * 坏 地 址 的 最 大 数量 


下 列 代 码 块 中 的 黑体 部 分 说 明了 怎样 使 用 装载 有 效 地 址 (LEA) 指令 来 初始 化 一 个 栈 指 
针 或 地 址 寄存 器 中 的 一 个 地 址 。 子 程序 调用 指令 JSR 被 初始 化 。 两 个 符号 变量 tests 和 
bad_cnt 是 程序 末尾 处 的 数据 存储 位 置 。 
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程序 开始 
初始 化 栈 指针 
初始 化 D0 
初始 化 坏 地 址 计数 
A2 指 向 测试 码 

指向 坏 地 址 计数 存储 处 
用 D6 来 测试 完成 码 
是 否 完成 ? 

是 的 ， 退出 

在 A0 中 建立 开始 地 址 
在 Al 中 建立 结束 地 址 
政 到 注 试 

得 到 当前 的 计数 

是 否 已 超过 最 大 值 
继续 


返回 到 模拟 器 


注意 我 们 保存 了 在 子 程序 中 使 用 的 寄存 器 。 我 们 不 需要 保存 A0、A1 和 A2 是 因为 它们 是 用 


宽 计 容 有 容 凌 砍 翰 裕 容 宾 页 商 帘 突 守 宙 玛 天 实 宙 次 商 裕 容 容 商 南 丙 站 容 容 识 丙 齐 突 灾 调 次 容 窑 寓 寓 站 正直 究 宽 富商 翰 守 主将 裕 次 次 次 次 向 突 宙 凋 丙 识 在 实 守 有 帘 识 真主 


汇 失 三 言 程序 说 坟 

ORG $400 * 

start LEA stack, SP 
CLR.B DO 六 
CLR.B bad_cnt * 
LEA tests,A2 * 
LEA bad addr,A3 * 

test_loop MOVE.B {22)+,D6 大 
CMPI.B #end._test,D6 * 
BEQ done * 
LEA st_addr,A0 二 
LEA end addr,Al 
JSR do_test * 
MOVE.B bad_cnt ,D7 * 
CMPI.B #maxcnt, D7 友 
BLT test-loap 类 

Qone STOP #S2700 * 

来 传递 我 们 使 用 的 地 址 参数 的 。 

* 

* 子 程序 do_test 

* 

* 该 子 程序 做 实际 的 测试 。 

* 有 0 保存 开始 地 址 。 


* 保存 结束 地 址 。A2 指 向 本 次 测试 中 使 用 的 测试 码 。 
* ”该 程序 将 测试 从 A0 到 A1 的 存储 位 置 ， 将 任意 失败 存储 位 置 的 地 址 存 人 bad_adar 并 递增 
* bad_cnt 的 计数 。 如 果 计 数 超过 10 测 试 就 会 终止 。 


大 


突 害 定 窑 究 兴 六 安安 突 闪闪 实 安 内 实 宙 六 二 帘 实 突 商 突 灾 灾 禄 灾 突 二 类 实 灾 富 安 雪 灾 妆 妆容 宙 闪 闪 妆 六 宙 灾 业 内 实 闪 六 宙 交 认 灾 当 灾 六 六 安安 突 闪 窜 寅 闪 认 内 风 实 闪 


do_test MOVEM.W A3/D1/D7,- (8P) 
check_loop MOVE .B (A2), (A0) 
MOVE .B (A0O)，DIL 
CMP.B (A2) ,D1 
BNE error byte 
BRA next_ test 
@rror byte MOVE.W AD0, (A3)+ 
ADDI.B #01,bad cnt 
MOVE.B bad_ cnt,D7 
CMPI.B #maxcnt ,D7 
BGE exit 
next test ADDA.W #01,A0 
CMPA.W 及 0 及 1 
BGE check_loop 
MOVEM .W (SP)+,A3/D1/D7 
exit RTS 


* 保存 寄存 器 
* 写字 节 
用 D1 保存 所 写 的 什 
进行 比较 


没有 问题 ， 继 续 测试 
存储 地 址 并 递增 指针 
递增 坏 地 址 计数 

是 否 已 超出 ? 

检查 
返回 ， 已 经 完成 。 
递增 A0 
测试 我 们 是 否 已 完成 
跳 回 并 测试 下 一 个 地 址 
恢复 寄存 器 
返回 到 测试 程序 


站 站 


数据 存储 区 域 包括 测试 码 和 用 来 存储 计数 和 坏 地 址 的 保留 存储 区 域 。 注 意 END 指 令 出 现 
在 所 有 源 代码 的 最 后 ， 而 不 只 是 程序 代码 的 最 后 。end_test 定 义 的 值 与 C 语 言 用 来 终结 字符 捉 
的 NULL 字 符 相 似 ， 每 次 通过 测试 循环 我 们 都 要 检查 这 个 字符 以 知道 程序 是 否 已 完成 。 


* 数据 存储 区 域 
tests DC.B testl,test2,test3,test4,end test * 测试 码 
padding DC.B 00 * 填充 函数 
bad_cnt DS.W 1 * 坏 地 址 计数 
bad addr DS.Ww 10 * 保留 10 个 地 址 的 空间 
END $400 * 程序 结束 点 并 装载 地 址 
建议 的 练习 


仔细 阅读 代码 然后 建立 流程 图 来 描述 它 是 如 何 工作 的 。 然 后 ， 创 建 一 个 源 文 件 并 在 模拟 
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器 中 运行 程序 。 为 了 测试 程序 ， 将 测试 的 结束 地 址 改 为 适当 接近 开始 位 置 的 地 方 ， 或 许 离开 
始 位 置 10 或 20 个 字 节 的 位 置 。 下 一 步 ， 汇 编 该 程序 ， 并 使 用 列表 文件 ， 在 子 程序 中 将 数据 写 
到 存储 器 的 指令 上 设置 断 点 。 使 用 跟踪 指令 将 数据 写 到 存储 器 ， 但 在 再 次 开始 跟踪 程序 之 前 
改变 存储 在 存储 器 中 的 值 。 换 句 话说， 强迫 使 测试 失败 。 查 看 程序 流程 并 确认 程序 正 按照 你 
所 预料 的 方式 运行 。 如 果 你 不 太 确定 为 什么 要 使 用 一 些 特定 指令 或 寻 址 模式 ， 那 么 请 复习 一 
下 你 的 笔记 或 参考 你 的 程序 员 参 考 手册 。 最 后 ， 使 用 这 个 程序 作为 一 个 框架 ， 看 看 你 能 不 能 
使 用 另外 一 些 寻 址 模式 或 指令 来 改进 它 。 请 为 这 个 练习 安排 足够 多 的 时 间 ， 它 相对 于 我 们 目 
前 所 学 的 所 有 编程 概念 来 说 是 非常 基础 的 。 


总 结 


本 章 讲述 了 以 下 主题 : 

计算 机 中 负数 和 实数 是 怎样 表示 和 操作 的 。 

转移 和 基于 CCR 中 标志 状态 的 条 件 代 码 执行 的 一 般 过 程 。 
68K 体 系 结构 的 主要 寻 址 模式 。 

高 级 语言 循环 结构 以 及 它们 在 汇编 语言 中 的 类 似 结构 。 
在 汇编 语言 程序 设计 中 使 用 子 程序 。 

一 个 用 来 测试 存储 器 的 汇编 语言 程序 的 详细 讲解 。 


参考 文献 


! Alan Clements, 68000 Family Assembly Language, ISBN 0-5349-3275-4, PWS Publishing Company, Boston, 
1994, p. 29 


习题 


1. 下 面 所 示 的 是 个 7 段 码 显示 器 的 示意 图 。 所 示 表 格 表 示 的 是 在 显示 器 上 显示 相应 数字 的 二 进 
制 代 码 。 因 此 ， 为 了 在 显示 器 上 显示 数字 “4”， 你 应 该 将 DB1、DB2、DB5 和 DB6 置 为 逻辑 
电 平 1 ， 而 其 他 所 有 数据 位 置 为 逻辑 电 平 0。 

。 显 示 器 存储 器 映射 到 字 节 地 址 $1000。 
。 地址 $1002 处 有 一 个 硬件 定时 器 。 




















。 通过 将 1 写 到 DB4 将 定时 器 启动 。DB4 。 计数。 ne 于 进 制 位 加。 
是 一 个 只 写 位 ， 读 取 它 将 总 会 得 到 一 
DB4 = 0 的 结果 。 1 00000110 

。 当 定时 器 被 启动 时 ，DB0 ( BUSY ) 下 
下 降 并 保持 为 低 500ms。500ms 后 ， 01010110 
定时 器 超时 ，DB0 再 次 上 升 。 oror | 

。DB0 是 只 读 的 且 对 它 写 不 会 影响 定时 | 6 | 61111101 | 
器 。 所 有 的 其 他 位 都 可 以 忽略 。 定 时 
器 控制 寄存 器 如 图 所 示 。 | | on | 

| 9 | olttool11| 


编写 一 个 较 短 的 68K 汇 编 语言 子 程 
序 ， 访 程序 从 寄存 器 D0.B 传 送 给 它 的 数 DB7 DB6 DB5 DB4 DB3 DB2 DB1 DB0 


你 机 显示 在 7 朋友 显 示 基 上 。， 反 寺 才 的 


X = 无 关 项 
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速率 是 每 两 秒 一 个 数字 。 
注 : 
。 这 是 一 个 子 程序 。 没 有 必要 使 用 ORG 来 开始 程序 ， 也 不 需要 建立 堆栈 指针 或 使 用 END 伪 
令 。 
。 你 可 以 假设 传递 给 D0.B 的 数据 在 1 到 9 的 范围 内 。 你 不 必 做 任何 错误 检测 。 当 计数 器 到 达 0 
时 子 程序 退出 。 


.假设 某 个 外 部 设备 给 你 的 计算 机 传送 了 一 系列 字 节 值 ， 伴 随 的 还 有 一 个 检验 和 值 


(checksum value) ， 可 用 来 检验 接收 到 的 字 节 序列 与 发 送 的 字 节 序列 是 否 相 同 。 为 了 做 到 这 
一 点 ， 你 必须 对 你 接收 到 的 字 节 流 计算 其 检验 和 ， 并 将 该 值 与 传送 给 你 的 检验 和 进行 比较 。 
如 果 它 们 相等 ， 那 么 传送 过 程 就 很 可 能 没有 错误 。 
A 部 分 : 编写 一 个 汇编 语言 子 程序 ， 而 不 是 一 个 程序 ， 用 它 来 计算 连续 存储 地 址 中 的 
字 节 流 的 检验 和 。 检 验 和 就 是 简单 地 取 所 有 字 节 值 的 和 ， 这 就 很 像 对 一 列 数据 求 和 。 检 验 
和 值 是 一 个 16 位 值 。 任 何 超出 16 位 的 溢出 和 进位 都 会 被 忽略 。 
1) 子 程序 所 需 信 息 通过 如 下 所 示 的 过 程 传 给 子 程序 ， 
a. 寄存 器 A0 = 存储 器 中 字 节 串 的 指针 ， 用 一 个 长 字 表示 。 
b. 寄 存 器 D0 = 传 给 子 程序 用 来 比较 的 检验 和 ， 用 一 个 字 值 表示 。 
c. 寄存 器 D1 = 字 节 流 的 长 度 ， 用 一 个 字 值 表示 。 
2) 检验 和 计算 过 程 中 ， 任 何 超过 16 位 的 溢出 和 进位 都 会 被 忽略 。 只 有 由 求 和 得 到 的 字 值 与 
检验 和 相关 。 
3) 如 果 计 算得 到 的 检验 和 与 传送 来 的 检验 和 相同 ， 那 么 地 址 寄存 器 A0 返 回 一 个 指针 ， 指 
向 字符 串 开始 的 地 方 。 
4) 如 果 检 验 和 比较 失败 了 ，A0 中 的 返回 值 就 被 置 为 0。 
5) 除了 地 址 寄存 器 A0 之 外 ， 所 有 的 寄存 器 从 子 程序 返回 时 都 应 当 保持 它们 的 初始 值 。 
B 部 分 : 如 果 在 字 节 流 中 存在 错误 但 是 却 不 能 用 这 种 方法 检测 到 的 可 能 性 是 多 大 ? 


.高 亮 指 令 完 成 后 ， 寄 存 器 D0 中 的 值 是 什么 ? 


00000400 4FF84000 START LEA $4000,SP 
00000404 3F3C1CAA MOVE.W #$1CAA, ~ (SP) 
00000408 3F3C8000 MOVE.W #$8000,- (SP) 
0000040C 223C00000010 MOVE.L #16,D1 
00000412 203C216E0000 MOVE.L #$216E0000,DO 
00000418 E2A0 ASR.L D1,DO 
0000041A 383C1000 MOVE.W #$1000,D4 
0000041E 2C1F MOVE.L (SP)+,D6 
00000420 C086 AND.L D6 ,DO 
00000422 60FE STOP_HERE BRA STOP_HERE 


. 编写 一 个 满足 下 列 描述 的 子 程序 ， 子 程序 将 下 列 变量 作为 它 的 输入 参数 列表 : 


寄存 器 A0 中 的 一 个 长 字 存储 地 址 ， 其 中 A0 指 向 已 经 存在 于 存储 器 的 32 位 整数 流 的 第 一 个 
元 素 。 

寄存 器 D1 中 的 一 个 32 位 长 字 值 ， 其 中 D1 中 的 值 是 一 个 搜索 关键 字 。 

寄存 器 D0 中 一 个 在 1 到 65 535 之 间 的 正 数 ， 其 中 DO 中 的 值 决定 了 到 底 A0 所 指 字 节 流 中 有 
多 少 个 整数 元 素 将 被 搜索 。 

子 程序 返回 值 存在 于 D2 中 ， 如 果 搜 索 关键 字 和 被 搜索 字 节 流 中 的 数字 没有 匹配 ， 返 回 值 
就 为 0， 否 则 为 第 一 个 匹配 数 的 存储 位 置 值 。 


注意 一 旦 发 生 匹 配 搜索 就 不 需 再 继续 ， 假 设 你 并 不 知道 调用 该 子 程序 的 主 程序 的 其 余 ”[224] 
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. 某 特 定 计算 机 系统 的 存储 器 布局 情况 为 ， ROM 地 址 从 0000 到 0x7FFF，RAM 地 址 从 0x8000 


到 0xFFFF。 下 面 的 一 段 代码 有 一 处 错误 ， 该 错误 是 什么 ? 


代码 段 : 
MOVE.W $1000,D0 
MOVE.W DO,$9000 
LEA.W $2000,Al 
MOVEA.W Al,A2 
MOVE.W DO, (A2) 


. 编写 一 个 简短 的 68K 汇 编 语言 程序 ， 访 程序 将 两 个 64 位 值 相 加 并 保存 结果 。 说 明 如 下 : 


a. 操作 数 1: 高 32 位 存储 在 存储 位 置 $1000 
b. 操作 数 1: 低 32 位 存储 在 存储 位 置 $1004 
c. 操作 数 2， 高 32 位 存储 在 存储 位 置 $1008 
d. 操作 数 2: 低 32 位 存储 在 存储 位 置 $100C 
结果 存储 如 下 : 
a. 高 32 位 在 存储 位 置 $1020 
b. 低 32 位 在 存储 位 置 $1024 
任何 高 位 加 法 产生 的 进位 都 在 存储 位 置 $101F。 


: 布 图 显示 的 是 一 个 由 8 荔 灯 组 成 的 环形 阵列 ， 这 个 阵列 被 连接 到 了 一 个 8 位 带 存 储 器 映射 和 


IO 端口 的 68K 计 算 机 系统 。 每 蔓 灯 由 IO 端口 中 
的 一 个 相应 位 控制 。 将 相应 位 设 为 1 就 会 打开 灯 ， 
设 为 0 就 会 将 灯 关 闭 。 

编写 一 个 简短 的 68K 汇 编 语言 程序 ， 该 程序 
顺序 打开 每 画 灯 ， 保持 两 秒 后 又 将 它 关 闭 ， 接 
着 再 打开 下 一 恤 灯 。 说 明 如 下 : 
。 8 位 宽 的 并 行 1O 端 口 映射 到 存储 地 址 $4000。 
。 存储 地 址 $8000 处 有 一 个 16 位 宽 的 时 延 端口 。 


DB0 到 DB11 代 表 一 个 可 以 产生 时 延 的 倒计时 


| 本 可 
定时 器 。 向 DB0-DB11 写 一 个 值 将 会 使 DB15 


由 低 变 高 , 然后 定时 器 就 会 从 存储 在 DB0-DB11 中 的 数 开 始 倒计时 到 0。 当 定时 器 到 达 0 时 ， 
DB15 会 再 次 变 低 且 定时 器 停止 计时 。 定 时 器 的 每 次 滴答 代表 lms。 因 此 ， 向 定时 器 号 
$300A 将 会 使 定时 器 倒计时 10ms。 


WO 端口 








DB15 DB11 DB0 
srlxjxjxjrirIrrIrITrITTITITTTTTTr 
ST = 定时 器 状态 ，1 = 倒计时 ，X = 未 使 用 

T = 定时 器 倒计时 值 
"DB15 是 一 个 只 读 位 ， 向 该 位 写 一 个 值 不 会 改变 它 也 不 会 产生 任何 问题 。 
”定时 器 没有 中 断 ， 你 必须 一 直 检查 相应 存 情 位 置 以 知道 定时 器 什么 时 候 停止 计数 。 





. 编写 一 个 简短 的 68K 汇 编 语言 子 程序 ， 该 程序 根据 以 下 要 求 将 一 个 ASCII 码 字符 串 发 送 到 一 


个 串口 : 
。 串口 被 存储 器 映射 到 地 址 $4000 和 $4001 的 两 个 连续 字 节 位 置 。 发 送 和 接收 字符 的 实际 端 
口 在 地 址 $4000， 状 态 端 口 在 地 址 $4001。 
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。 状态 端口 的 数据 位 0 (DB0) 被 指定 用 来 指示 传送 缓冲 器 的 状态 。 当 串 行 设 备 准 备 好 传送 
下 一 个 字符 时 ， 传 送 缓冲 器 空 (Transmit ter Buffer Empty) 信号 为 真 (TBE = 1)。 当 传 
送 缓冲 器 为 空 时 ， 下 一 个 字符 将 被 发 送 。 向 地 址 $4000 写 一 个 字符 可 能 会 启动 串 行 数据 传 
送 并 置 TBE = 0。 当 TBE = 1 时 下 一 个 字符 就 可 以 被 发 送 。 

。 在 和 人口 处 ， 子 程序 应 该 保存 可 能 使 用 到 的 任何 寄存 器 的 值 ， 在 出 口 时 再 将 它们 恢复 。 

。 待 打印 的 字符 串 位 置 从 寄存 器 A0 传 送 到 子 程序 中 。 

。 字 符 串 以 空 字符 $FF 结 束 。 

。 堆栈 指针 已 经 被 初始 化 ， 没 有 必要 建立 一 个 堆栈 指针 。 

。 假 设 这 是 一 个 没有 中 断 发 生 的 轮流 检测 的 循环 。 你 必须 不 断 测试 TBE 的 状态 以 便 知 道 什 
么 时 候 发 送 下 一 个 字符 。 

9. 编写 一 个 程序 将 两 个 指定 位 置 之 间 的 存储 器 都 以 字 码 $35555 填 充 。 这 与 指令 集 模拟 器 (ISS) 
中 的 块 填充 (BF) 命令 类 似 ， 但 是 你 必须 用 68K 汇 编 语言 代码 来 完成 。 要 填充 的 存储 区 域 
是 $2000 到 $20FF 之 间 并 包括 两 端的 范围 。 

10. 编写 一 个 存储 器 测试 程序 ， 该 程序 能 够 以 字 (一 次 16 位 ) 来 测试 从 $00001000 到 $0003FFFF 
之 间 的 存储 区 域 。 它 应 该 向 上 测试 ， 包 括 $0003FFFF， 但 不 超过 它 。 存 储 器 测试 程序 的 工 
作 如 下 所 示 : 

。 用 字数 据 值 填充 被 测试 区 域 中 的 每 一 个 存储 位 置 。 

。 读 回 每 一 个 存储 位 置 并 将 它 与 你 所 写 的 数据 值 进行 比较 。 如 果 它 们 不 相同 ， 那 么 就 有 坏 
存储 位 置 。 

。 使 用 两 个 不 同 的 测试 码 $FFFF 和 $AAAA 开 始 测试 存储 器 。 

。 当 你 用 一 种 测试 码 测 试 完 后 ， 对 它 的 位 取 反 (1 改 成 0 且 0 改 成 1) 并 用 新 的 测试 码 重复 进 
行 测试 。 因 此 ， 你 将 使 用 这 些 测 试 码 重 复 测 试 4 次 。 

。 使 用 开始 的 测试 向 量 $0001 至 少 再 重复 测试 一 次 。 使 用 ROL.IL 指 令 在 每 次 通过 存储 器 测试 
时 左 移 1 位 ， 直 到 你 已 经 运行 了 16 次 存储 器 测试 ， 每 次 你 重复 测试 时 都 要 把 1 左 移 一 位 。 

。 将 你 刚才 使 用 的 测试 码 取 反 ， 重 复 上 面 的 移 位 测试 。 

。 这 里 是 任务 中 的 一 些 细节 , 

一 程序 应 该 从 存储 地 址 $00000400 处 开始 运行 (用 ORG ) 。 

一 程序 测试 从 $00001000 到 $0003FFFF 的 存储 区 域 ， 包 括 两 端 。 

一 堆栈 指针 应 该 定位 在 $000A0000。 

一 初始 的 测试 码 是 ，$FFFF、$AAAA 和 $0001。 

一 该 测试 将 用 测试 码 之 一 来 填充 相关 的 存储 区 域 。 接 着 ， 它 把 测试 码 读 回 并 将 读 回 的 值 
和 所 写 的 值 进行 比较 。 如 果 你 编写 的 程序 在 向 存储 器 中 写 一 个 字 后 立即 又 将 其 读 回 ， 
- 那么 你 就 没有 按照 要 求 来 编程 。 

一 视 试 不 断 重复 ， 所 用 的 测试 码 分 别 是 ， 两 个 开始 测试 码 、 他 们 的 反 码 、 移 位 码 以 及 补 码 。 

一 如 果 检 测 到 错误 ， 则 错误 发 生 处 的 存储 地 址 、 所 写 数 据 以 及 读 回 数据 都 将 被 存储 在 存 
储 变量 中 。 

一 如 果 发 生 了 两 次 ( 含 两 次 ) 以 上 的 错误 ， 那 么 程序 应 该 存储 总 的 错误 数 (发 现 的 坏 存 
储 位 置 数 )， 但 只 保存 最 近 一 次 错误 的 地 址 信息 和 数据 信息 。 

一 应 该 允许 多 至 65 535 个 坏 存 储 位 置 的 计数 。 
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讨论 
该 程序 包含 了 汇编 语言 程序 设计 的 很 多 基础 知识 。 如 果 你 学 习 了 该 程序 ， 你 将 看 到 该 
程序 使 用 了 一 个 子 程序 来 实际 检测 存储 器 。 想 像 一 下 ， 如 果 你 用 C 语 言 编 写 ， 那 会 是 怎样 

的 呢 ? 你 如 何 将 测试 码 传 给 函数 ? 

。 别 忘 了 初始 化 栈 指 针 ! 

。 程序 中 有 几 个 循环 结构 ， 它 们 是 哪些 ? 你 将 怎样 定义 被 测试 的 存储 区 域 ? 你 怎么 能 知道 
你 完成 了 所 有 的 测试 ?你 如 何 知道 你 是 否 写 完 了 所 有 要 写 的 存储 位 置 ? 

。 确认 你 掌握 了 怎样 使 用 伪 操作 代码 EQU、ORG、CRE、DC.L、DC.B、DC.W 以 及 DS 民 、 
DS.W、DS.B、END。 

。 掌握 指令 JS、RTS、LEA 和 寻 址 模式 (Am 和 (Am+。 . 

。 该 程序 可 以 用 不 到 50 条 的 指令 来 完成 ， 但 是 你 要 知道 你 现在 想 要 做 的 是 什么 。Easy68K 模 
拟 器 计算 周期 。 程 序 若 能 在 更 少 的 时 钟 周 期 内 完成 ， 就 算 它 需 要 更 多 的 指令 ， 也 通常 是 
更 高 效 的 程序 。 

。 分 阶段 进行 编程 。 一 旦 你 已 经 完成 了 程序 流程 图 ， 就 编写 每 一 块 的 汇编 代码 并 测试 该 代 
码 。 你 怎样 测试 呢 ? 你 可 以 将 它 汇编 。 如 果 你 能 正确 地 汇编 ， 那 你 就 已 经 取得 进步 了 。 
下 一 步 ， 将 其 运行 在 模拟 器 上 并 验证 它 是 不 是 正在 做 你 想 要 它 所 做 的 事 。 

。 当 你 测试 你 的 程序 时 ， 一 个 好 的 编程 技巧 是 使 用 等 于 伪 指 令 (EQUate) 来 将 你 测试 的 存 
储 范 围 改 为 儿 个 字 ， 而 不 是 整个 空间 ， 那 样 你 就 能 很 快 地 修改 代码 。 因 此 ， 可 以 不 测试 
从 $00001000 到 $0003FFFF 的 范围 而 测试 从 $00001000 到 $0000100A 的 区 间 。 

。 看 看 当 一 个 存储 位 置 上 有 坏 数据 时 会 发 生 什 么 。 在 程序 用 测试 码 填充 完 某 个 存储 地 址 之 
后 ， 使 用 模拟 器 改变 该 存储 位 置 处 的 数据 值 。 你 的 程序 是 否 会 发 现 该 错误 呢 ? 它 能 处 理 
这 个 错误 吗 ? Easy68K 模 拟 器 有 一 个 很 好 的 能 够 从 视图 窗口 访问 的 存储 器 接口 。 

。 该 程序 几乎 只 是 由 MOVE、Bcc 和 CMP (CMPA) 这 三 种 指令 组 成 的 。 寻 址 模式 可 能 是 寄 
存 器 间接 寻 址 ， 因 为 你 们 总 是 不 断 地 向 连续 存储 位 置 写 并 不 断 从 连续 存储 位 置 读 回 。 地 
址 寄存 器 是 保存 开始 地 址 、 结 束 地 址 以 及 你 当前 在 存储 器 中 的 地 址 的 理想 地 方 。 为 了 指 
向 下 一 个 存储 位 置 ， 就 递增 地 址 寄存 器 的 内 容 。 你 可 以 显 式 地 用 加 法 完成 ， 或 者 隐 式 地 
使 用 (An) + 寻 址 模式 。 

"思考 当 你 使 用 ROL 指 令 时 你 怎样 结束 测试 。 你 可 以 建立 一 个 计数 器 ， 然 后 计数 32 次 ， 这 
种 方法 是 可 行 的 。 但 是 ， 仔 细 看 看 ROL 指 令 ， 当 “1” 超 出 最 高 有 效 位 (MSB) 时 它 跑 到 
哪里 去 了 呢 ? 什 么 指令 可 以 用 来 测试 这 个 条 件 呢 ? 
程序 的 大 致 结构 应 当 如 下 : 

a. 注释 头 块 : 描述 程序 做 什么 。 

b. 系统 的 等 于 伪 指 令 : 定义 变量 。 

c.ORG 声 明 : 程序 从 这 里 开始 。 

d. 主 程序 代码 ， 除 子 程序 之 外 的 所 有 东西 都 在 这 里 。 

e. 指令 STOP $#2700， 正常 结束 程序 并 返回 模拟 器 。 

f. 子 程序 头 块 : 所 有 的 子 程序 都 应 有 自己 的 头 块 。 

g. 子 程序 标号 : 每 个 子 程序 在 第 一 条 指令 处 都 应 该 有 一 个 标号 。 否 则 你 不 能 从 当前 位 置 跳 
到 那里 。 

h. 子 程序 代码 : 这 就 是 真正 工作 的 代码 。 别 忘 了 和 弄 清楚 哪些 寄存 器 在 工作 以 及 参数 是 怎样 
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传递 的 。 

i. RTS: 每 个 子 程序 最 终 都 必须 返回 。 
j. 数据 区 域 : 用 DC 和 DS 伪 代码 定义 的 所 有 变量 都 存在 这 里 。 
k. END : 程序 的 最 后 一 行 应 该 是 END $400。 这 告诉 汇编 器 程序 在 这 里 结束 并 装载 到 $400。 

如 果 你 仍然 失败 了 ， 请 复习 一 下 本 章 中 存储 器 测试 程序 的 例子 。 最 后 ， 注 意 如果 你 将 
程序 运行 在 多 种 Windows 形 式 下 你 可 能 会 发 现 奇 怪 的 行为 。 如 果 运 行 在 一 小 块 存储 区 域 程 
序 可 能 运行 得 很 快 ， 但 是 如 果 运 行 在 一 块 更 大 的 存储 区 域 程序 就 会 死 掉 。 这 不 是 程序 的 错 
误 。 这 是 Windows 在 运行 控制 台 应 用 程序 时 出 现 的 问题 。 

Windows 在 控制 台 窗 口中 监视 VO 活动 。 当 它 在 窗口 中 没有 看 到 任何 输入 或 输出 时 ， 它 
将 严格 限制 给 予 窗口 中 应 用 程序 的 CPU 周 期 数 。 因 此 ， 一旦 你 的 程序 开始 占用 时 钟 运行 时 ， 
Windows 就 会 进一步 压制 它 。 

关于 这 个 问题 有 几 种 方法 ， 具 体 要 取决 于 你 的 Windows 版 本 。 当 程序 在 运行 时 你 可 以 
试图 敲 击 ENTER 键 。 它 在 窗口 中 不 会 做 任何 事 ， 但 是 它 会 愚弄 操作 系统 ， 使 你 的 程序 保持 
活动 。 

另 一 种 方法 是 打开 窗口 中 的 属性 菜单 进行 灵敏 度 设置 ， 使 得 Windows 不 会 将 你 的 程序 
关 掉 。 这 种 方法 在 学 校 里 的 Win 98SE 和 Win 2000 上 可 行 。 
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学 习 上 有 目标 

。 使 用 68K 处 理 器 体系 结构 的 所 有 寻 址 模式 和 指令 进行 汇编 语言 编程 ， 
。 描述 汇编 语言 指令 和 寻 址 模式 是 如 何 支 持 高 级 语言 的 ， 

。 将 存储 器 映像 反 汇编 到 指令 集体 系 结构 ， 

。 描 述 单 板 计算 机 系统 的 元 件 和 功能 。 


9.1 引言 


既然 我 们 有 了 充足 的 68K 编 程 原理 的 背景 知识 ， 让 我 们 更 密切 地 考察 一 下 另外 一 些 指 令 和 
寻 址 模式 ， 以 便 更 深入 地 探究 这 个 问题 。 从 一 个 汇编 语言 编程 者 的 角度 看 ， 我 们 现在 将 要 探 
究 的 寻 址 模式 更 加 冷 储 ， 但 如 果 你 要 用 C 或 C++ 作 为 开发 语言 来 为 68K 系 列 处 理 器 编程 ， 那 么 
这 些 寻 址 方式 就 极为 重要 了 。 

由 于 占 压倒 性 的 绝 大 多 数 的 程序 员 都 用 C 或 C++ 写 程序 ， 所 以 对 计算 机 设计 者 来 说 ， 具 有 
支持 高 级 语言 结构 的 寻 址 模式 就 是 一 个 重要 的 考虑 事项 。 我 们 将 要 学 习 的 寻 址 模式 就 能 使 我 
们 实现 数据 结构 和 编写 与 位 置 无 关 的 代码 ， 或 称 可 重 定位 (relocatable) 代码 。 

因为 没有 对 包含 指令 或 数据 的 存储 空间 的 绝对 引用 (absolute reference) ， 所 以 可 重 定位 
代码 可 在 处 理 器 地 址 空间 的 任何 地 方 运行 。 能 装 入 地 址 空间 任何 地 方 的 这 个 特性 是 重要 的 ， 
因为 操作 系统 必须 能 以 这 样 一 种 方式 来 管理 任务 和 存储 器 : 一 个 任务 (程序) 可 能 一 次 在 地 
址 $A30000 处 开始 运行 而 另 一 次 在 地 址 $100000 处 开始 运行 。 另 外 ， 从 占用 的 存储 大 小 和 速度 
方面 考虑 ， 与 位 置 无 关 的 程序 效率 更 高 ， 因 为 跳 转 和 取 数 的 目的 地 是 由 寄存 器 的 内 容 决 定 的 ， 
而 不 是 作为 指令 的 一 部 分 从 存储 器 中 得 到 的 。 

在 开始 学 习 高 级 寻 址 模式 前 ， 你 可 能 想 知道 可 重 定位 代码 和 绝对 地 址 引用 的 思想 。 请 看 
下 面 的 代码 片段 : 


start LEA $4000,A0 
MOVE.W DO, (A0) 


我 们 做 了 绝对 地 址 引用 了 吗 ? 绝对 是 (对 不 起 )! 然而 , 一 旦 我 们 有 一 个 地 址 在 寄存 器 中 ， 
即使 它 开始 来 源 于 绝对 引用 ， 我 们 也 有 能 力 来 根据 程序 装 入 存储 器 的 地 点 来 修改 这 个 地 址 。 


9.2 高 级 寻 址 模式 


模式 S， 带 位 移 的 寄存 器 间接 寻 址 
将 一 个 带 符 号 的 〈 正 或 负 ) 16 位 位 移 与 地 址 寄存 器 内 容 相 加 来 形成 有 效 地 址 。 这 样 ， 有 
效 地 址 (EA) = (An) +/ 一 16 位 位 移 。 例 如 ， 如 果 <A6> = $1000， 则 指令 : 
MOVE.L  $400(A6) ,DO0 
将 取出 位 于 存储 地 址 $1400 中 的 长 字 ， 并 将 其 拷贝 到 数据 寄存 器 D0 中 。 这 个 寻 址 模式 是 很 重 
要 的 ， 因 为 它 被 用 来 在 C 函 数 中 定位 局 部 变量 。 
这 就 是 上 述 指令 的 寻 址 方法 。 在 程序 员 参 考 手 册 中 ， 该 指令 的 另外 一 种 表现 形式 为 〈dis， 
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An)。 这 两 种 形式 都 有 可 能 使 你 相信 上 例 中 的 $400 是 一 个 位 移 值 。 然 而 ， 大 多 数 汇 编程 序 不 指 
望 你 自己 计算 位 移 值 。 汇 编 器 料想 你 会 插入 一 个 标号 或 绝对 存储 器 引用 ， 它 就 为 你 计算 出 位 
移 值 。 这 样 ， 数 字 $400 不 应 该 被 解释 成 $400 的 位 移 ， 而 是 应 该 作为 你 希望 从 那里 计算 位 移 的 
存储 位 置 。 因 此 ， 如 果 你 的 汇编 程序 向 你 报错 ， 如 位 移 过 大 (displacement too large) 或 越界 
错误 (out-of-range error) ， 那 么 这 指 的 可 能 是 绝对 地 址 或 标号 而 不 是 偏 移 。 

当 你 在 C 或 C++ 语言 中 进行 函数 调用 时 ， 编 译 器 会 建立 一 个 堆栈 帧 (stack frame) ， 用 地 址 
寄存 器 之 一 作为 堆栈 指针 。 不 同 变量 的 地 址 用 它们 相对 于 指针 的 位 移 来 辨别 。 这 样 ， 如 果 A6 
指向 函数 foo( ) 堆栈 帧 的 开始 处 ， 则 要 取出 的 局 部 变量 位 于 从 指针 开始 的 $400 字 节 处 。 

模式 6， 带 变 址 的 寄存 器 间接 寻 址 

地 址 寄存 器 的 内 容 和 变 址 寄存 器 (A0...A6 或 D0...D6) 的 内 容 相 加 ， 再 加 上 一 个 8 位 的 位 移 : 

EA = (An) + (Xn) + ds 

如 果 <A5> = $00001000 且 <D3> = $AAAA00C4， 则 指令 

MOVE.W $40 (A5,D3.W) ,D4 

将 取出 存储 器 位 置 $900001104 的 字 内 容 ， 并 将 数据 找 贝 到 寄存 器 D4。 为 了 解 这 个 过 程 ， 

在 模拟 器 中 试 着 运行 一 下 这 个 代码 片段 : 


例子 
org $400 
lea $00001000,AS5 


move.l1 #$AAAAOQOC4,D3 
move.w #$AAAA,D1 
move.w D1,$40{A5,D3.W) 
stop #$2700 

end $400 


起 先 ， 你 可 能 想 有 效 地 址 应 该 是 $AAAA1104。 然 而 ， 这 个 指令 的 变 址 寄存 器 D3 用 的 只 是 
字 的 值 (而 不 是 长 字 的 值 ) 来 计算 有 效 地 址 。 

这 个 寻 址 模式 可 能 看 起 来 很 陌生 ， 但 假设 你 已 经 用 C 建 立 过 一 个 复合 数据 类 型 (结构 ) 的 
数组 ， 每 个 数据 类 型 距 结构 的 开始 处 有 固定 的 偏 移 量 。 为 了 访问 特定 结构 的 特定 数据 元 素 ， 
你 必须 用 D3 索引 到 数组 中 ， 然 后 再 用 固定 偏 移 量 $40 寻 找 特定 的 元 素 。 

模式 7， 子 类 2: 带 位 移 的 程序 计数 器 

将 一 个 带 符号 的 16 位 位 移 加 入 到 程序 计数 器 当前 的 内 容 中 。 

EA = (PC) + dis 
这 是 一 个 称 为 PC 相对 (PC relative) 的 一 般 寻 址 模式 类 的 一 个 例子 。 请 不 要 将 它 的 意思 误解 
为 是 与 PC 相关 的 一 些 东 西 ， 如 Palm Pilot。PC 相 对 寻 址 是 产生 可 重 定位 代码 所 需要 的 最 重要 
的 寻 址 模式 。 在 PC 相对 寻 址 中 ， 操 作 数 的 有 效 地 址 是 通过 将 字 的 带 符号 扩展 (sign extended) 
值 加 入 到 PC 的 当前 值 中 来 计算 的 。 然 后 所 产生 的 地 址 被 放 入 到 地 址 线 上 ， 并 从 外 部 存储 器 中 
取出 数据 。 

例如 ， 假 设 <PC> = $D7584420。 

$7AFE = 0111 1010 1111 1110。 对 最 高 有 效 位 〈 加 下 划 线 的 ) 进行 带 符号 扩展 至 32 位 ， 
就 得 到 0000 0000 0000 0000 0111 1010 1111 1110。 ， 

EA = $D7584420 + $00007AFE = $D758BF1E 


当 指 令 MOVE .W $100(PC)，D4 运 行 时 ， 如 果 在 程序 中 该 点 处 <PC> = $00000400， 则 在 
储 器 位 置 $500 处 的 字 内 容 就 从 存储 器 中 取出 并 拷贝 到 D4。 然 而 ， 若 该 代码 片段 被 重新 放置 到 
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存储 器 中 的 另 一 个 地 方 并 重新 运行 ， 则 只 要 被 取 的 数据 位 于 指令 $100 字 节 的 地 方 就 仍 能 正确 
取出 该 数据 。 

其 原因 就 是 程序 计数 器 的 当前 值 将 被 用 于 计算 有 效 地 址 。PC 总 是 指向 要 从 存储 器 中 取出 
的 下 一 条 指令 ， 不 管 该 程序 代码 处 于 存储 器 的 哪个 地 方 。 只 要 计算 出 来 的 有 效 地 址 位 于 一 个 
距 PC 当 前 值 固定 的 距离 ， 就 万 事 大 吉 了 。 

跳 转 指令 (JUMP) 和 跳 转 到 子 程序 (JUMP TO SUBROUTINE) 指令 也 是 这 种 情况 。 到 
目前 为 止 ， 我 们 总 是 认为 JMP 指 令 和 JSR 指 令 的 目的 地 址 是 绝对 的 。 然 而 ， 考 虑 下 面 两 个 代码 
例子 : 

例子 : 情况 1 

JSR foo * 汇编 器 为 foo 生 成 绝对 地 址 

例子 : 情况 2 

JSR ”foolPC) * 汇编 器 生成 相对 地 址 
foo {这 里 有 更 多 指令 } 
RTS * 从 子 程序 返回 

在 情况 1 中 ， 汇 编 器 为 标号 foo 计 算 了 绝对 地 址 。 当 指令 执行 时 ， 下 一 条 指令 的 地 址 被 放 
入 到 堆栈 ， 而 foo 的 绝对 地 址 被 放 入 到 PC。 从 存储 器 中 取出 的 下 一 条 指令 就 是 位 于 地 址 foo 
处 的 指令 。 

在 情况 2 中 ， 汇 编 器 计算 从 PC 当前 值 到 foo 的 位 移 (距离 )。 当 指令 执行 时 ， 下 一 -条 指令 
的 地 址 (PC 的 当前 值 ) 被 放 和 堆栈， 位 移 被 加 到 PC 的 当前 值 ， 并 将 相 加 的 和 返回 到 PC。 下 一 
条 指令 就 从 地 址 foo 处 取出 。 

然而 ， 只 有 情况 2 才 允 许 将 程序 ( 主 程序 代码 加 上 子 程序 ) 移 到 存储 器 中 的 其 他 位 置 而 无 
须 重 调整 所 有 地 址 。 

模式 7， 子 类 3: 带 变 址 的 程序 计数 器 

程序 计数 器 的 内 容 加 上 变 址 寄存 器 (A0...A6 或 D0...D6) 的 内 容 ， 再 加 上 8 位 位 移 。 这 样 ， 
EA = (PC) + (Xn) + dg。 

例子 

MOVE.W $40(PC,D3.L),D6 

这 个 寻 址 模式 与 带 位 移 的 寄存 器 间接 寻 址 完全 相同 ， 除了 采用 PC 而 不 是 地 址 寄存 器 作为 
基 寄 存 器 来 进行 地 址 计算 。 

总 之 ， 对 于 基于 表 、 字 符 串 、 数 组 、 链 表 等 数据 类 型 的 算法 ， 变 址 寻 址 (用 另 一 个 寄存 
器 提供 可 变 的 位 移 ) 是 一 种 强 有 力 的 实现 方法 。 位 移 值 提供 了 从 程序 计数 器 当前 值 到 表 ( 基 
地 址 ) 开始 处 的 恒定 的 偏 移 。 变 址 寄存 器 提供 了 到 表 中 的 可 变 指针 。 通 过 采用 PC 相对 寻 址 模 
式 ， 整 个 表 自 动 地 随 程序 移动 。 这 在 编译 器 操作 中 非常 有 用 ， 在 那里 需要 用 一 个 在 结构 中 恒 
定 的 偏 移 (位 移 ) 来 对 变量 寻 址 。 


9.3 68000 指 令 


在 这 里 的 每 个 种 类 的 指令 都 有 若干 个 变种 。 例 如 ，&ADD 指 令 系 列 包括 ， 

。ADD: 将 一 个 有 效 地 址 加 到 一 个 数据 寄存 器 或 将 一 个 数据 寄存 器 加 到 一 个 有 效 地 址 。 
。ADDA: 将 一 个 有 效 地 址 加 到 一 个 地 址 寄存 器 。 

。ADDI: 将 一 个 立即 数值 加 到 一 个 有 效 地 址 。 

。 RDDQ: 将 一 个 从 1 到 8 之 间 的 立即 数 加 到 一 个 有 效 地 址 。 
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。ADDX: 将 一 个 数据 寄存 器 值 加 到 一 个 数据 寄存 器 ， 包 括 X 位 的 值 。 

如 你 所 知 ， 有 效 地 址 也 许 是 我 们 迄今 所 学 过 的 某 些 或 全 部 寻 址 模式 。 显 然 ， 要 完成 你 要 
做 的 工作 ， 可 有 很 多 种 方式 来 构造 指令 。 结 论 就 是 学 习 用 汇编 语言 编程 就 像 用 字典 来 学 习 说 ”1232 
话 ， 先 学 习 一 些 简单 的 词 ， 然 后 扩大 你 的 词汇 量 ， 以 提高 你 用 词 的 丰富 性 和 效率 。 大 多 数 算 
法 都 可 用 多 种 方式 编写 ， 但 没有 丰富 的 编程 经 验 就 很 难 编写 出 最 有 效 的 算法 。 首 先 要 使 你 的 
算法 能 够 运行 ， 然 后 再 努力 调整 提高 它 ! 


9.4 移动 指令 


MOVE (移动 数据 ): 将 数据 从 源 拷贝 到 目的 地 。 你 如 今 应 该 知道 这 条 指令 了 。 
MOVEA (移动 地 址 ) : 将 数据 拷贝 到 地 址 寄存 器 。 目 的 地 总 是 地 址 寄存 器 ， 数 据 大 小 必须 
是 字 或 长 字 。 请 看 下 面 给 出 的 MOVE 和 MOVER 指 令 的 格式 : 











MOVE 指 令 : 

15 14 13 12 11 9 8 6 5 3 2 0 
0 0 大 小 目的 寄存 器 目的 模式 源 模式 源 寄存 器 
MOVEA 指 令 : 

15 14 13 12 11 9 8 6 5 3 2 0 











0 0 大 小 目的 寄存 器 0 0 1 源 模 式 源 寄存 器 


它们 看 起 来 不 相同 ， 直 至 你 认识 到 位 8、7、6 只 是 定义 了 一 种 模式 1 寻 址 模式 ,就 是 寄存 
器 直接 寻 址 模式 ， 所 以 我 们 仍 没有 真正 理由 要 单独 设 一 条 指令 。 共 真正 理由 是 由 于 操作 大 小 
所 施加 的 限制 使 得 我 们 需要 有 不 同 的 表示 。 由 于 MOVEA 指 令 只 能 将 字 或 长 字 值 移动 到 地 址 寄 
存 器 ， 所 以 我 们 要 尽 可 能 地 减少 粗心 大 意 地 写 出 非法 操作 代码 的 情况 的 可 能 性 。 

MOVEM (移动 多 个 寄存 器 ): MOVEM 指 令 只 能 用 于 将 寄存 器 移动 到 存储 器 或 相反 。 它 最 常 
与 带 后 递增 和 前 递减 的 寻 址 模式 一 起 使 用 。 前 递减 用 于 将 寄存 器 传送 到 存储 器 中 的 一 个 堆栈 
结构 ， 而 后 递增 用 于 将 数据 从 存储 器 堆栈 传 回 到 寄存 器 。 对 于 系统 堆栈 ， 堆 栈 指针 可 能 是 SP 
寄存 器 ， 对 于 用 户 堆栈 帧 ， 堆 栈 指针 则 是 其 他 地 址 寄存 器 中 的 一 个 。 寄 存 器 列表 的 顺序 并 不 
重要 ， 因 为 68000 总 是 以 A7 到 A0， 然 后 D7 到 D0 的 顺序 写 存储 器 。 它 总 是 以 D0 到 D7， 然 后 A0 
到 A7 的 顺序 从 存储 器 读 。 


9.5 逻辑 指令 

AND 

RND 指 令 执行 按 位 逻辑 与 操作 。 例 如 ， 如 果 在 指令 RND.W D0， D1 执 行 之 前 ，<D0> = 
$3795ACSF 且 <D1l> = $B6D34B9D， 则 指令 执行 后 ，<D0> = $3795AC5F, <D1> = 
$B6D3081D。 注 意 在 操作 中 只 使 用 了 各 寄存 器 的 低 16 位 。 为 了 弄 明白 为 什么 是 这 个 结果 ， 让 
我 们 用 二 进 制 来 做 按 位 与 操作 : 

例子 


$3795ACS5F = 0011 0111 1001 0101 1010 1100 0101 1111 


$BED34B9D = 1011 0110 1101 0011 0100 1011 1001 1101 


$3691081D = 0011 0110 1001 0001 0000 1000 0001 1101 
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要 记 住 的 一 个 简单 窍门 是 : 

。 任意 一 个 十 六 进 制 数字 和 F 做 与 操作 后 得 到 的 还 是 这 个 数字 

”任意 一 个 十 六 进 制 数 字 和 0 做 与 操作 后 得 到 的 还 是 0 

ANDI 

ANDI : 和 立即 数 做 与 操作 。 例 如 ，ANDI.B #$5A,，D7 
9.6 其 他 逻辑 指令 

。 0OR: 执行 按 位 逻辑 或 

。ORI : 和 立即 数 做 或 操作 

。EOR: 执行 按 位 逻辑 蜡 或 

。 EORI: 和 立即 数 做 异 或 操作 

。NOT: 对 操作 数 做 按 位 逻辑 反 操作 


NOT 指 令 只 需要 单个 操作 数 。 如 果 <D3> = $FF4567FF， 则 指令 NOT.B D3 将 使 D3 中 的 数 
据 变 为 <D3> = $FF456700。 注 意 你 不 能 用 NOT 立 即 数 这 种 指令 ， 因 为 NOTI .B#$67 没 有 意义 。 
移 位 指令 和 循环 移 位 指令 

这 组 指令 根据 移动 多 少 个 位 置 和 有 效 地 址 是 寄存 器 还 是 存储 器 而 有 不 同 的 规则 。 移 位 指 
令 和 循环 移 位 指令 能 对 位 和 数据 字 的 各 部 分 进行 操作 ， 以 便 对 这 些 数据 更 好 地 进行 算术 和 愉 
辑 操作 ， 因 此 是 非常 重要 的 。 

例如 ， 假 设 你 从 一 个 调制 解 调 器 中 读 了 4 个 ASCII 字 符 ， 这 些 字 符 是 $31、$41、$30 和 $30。 
而 且 ， 假 设 字符 是 4 位 十 六 进 制 数字 。 如 果 你 参考 ASCII 值 的 表 ， 就 会 发 现 它们 表示 数字 
$1A00， 但 是 如 何 从 这 4 个 ASCI 字 节 得 到 数字 $1A00 呢 ? 我 们 需要 一 个 转换 算法 。 

我 们 很 快 就 会 回 到 这 个 问题 并 学 习 一 个 算法 来 解决 这 个 问题 。 现 在 ， 让 我 们 看 一 下 移 位 
和 循环 移 位 是 什么 意思 。 见 图 9-1。 

ASL 指 令 将 字 节 、 字 、 ASL- 算 术 左 移 
长 字 或 更 多 位 置 的 每 一 位 向 
左 移动 。 每 次 移 位 ，0 就 被 村 





入 到 最 低 有 效 位 的 位 置 DB0。 宇多 05 位， 

占据 最 高 有 效 位 位 置 的 位 。 永远 丢失 ”ASR 算术 丰 移 
DB7、DB15 或 DB31 就 移动 
到 条 件 码 寄存 器 (CCR) 的 ee 
进位 位 和 扩展 位 ， 在 CCR 中 ~ 

的 位 就 被 抛弃 了 。 这 样 ， 执 长 字 = 第 31 位 


行 指令 aSL.B #3,， DO 日 执 
行 前 <DO> = $AB005501， 则 
指令 完成 后 ，D0 被 移 位 三 次 的 结果 就 是 <D0> = $AB005508。 通 过 每 次 将 数字 向 左 移 位 ，ASL 还 
有 将 数据 乘 以 2 的 效果 。 

其 他 的 移 位 和 循环 移 位 指令 与 ASL 和 ASR 的 操作 方式 类 似 。 图 9-2 总 结 了 这 些 指 令 的 行为 。 
比较 图 9-1 和 图 9-2， 我 们 看 到 一 些 指令 似乎 展示 出 相同 的 行为 ， 比 如 ASL 和 LSL 指 令 ， 但 ASR 
和 LSR 稍 有 不 同 。 


图 9-1 算术 左 移 和 算术 右 移 指令 的 操作 
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LSL- 逻 辑 左 移 


EA 
i EN 
LSR- 逻 辑 右 移 | -| - 
ROR- 循 环 右 移 


[|| 


| 


ROXL- 带 扩展 的 循环 左 移 
ROL- 循 环 左 移 


ROXR- 带 扩展 的 循环 右 移 
图 9-2 逻辑 左 / 右 移 和 循环 左 / 右 移 指令 


让 我 们 总 结 一 下 使 用 移 位 和 循环 移 位 指令 的 精 要 点 : 

。 这 个 组 的 指令 可 以 是 字 节 、 字 或 长 字 的 操作 。 

。 操作 数 只 能 是 数据 寄存 器 D0-D7 的 内 容 ， 或 者 是 存储 器 位 置 的 内 容 。 

。 当 涉及 到 数据 寄存 器 时 ， 指 令 必须 提供 移 位 的 次 数 。 

。 如 果 移 位 的 次 数 少 于 8 ， 就 采用 立即 数 的 形式 。 

。 如 果 移 位 的 次 数 多 于 8 ， 则 该 次 数 必 须 放 在 另 一 个 数据 寄存 器 中 。 

。 当 涉及 到 存储 器 位 置 时 ， 一 次 只 能 移动 一 位 ， 且 只 允许 字 操 作 数 。 | 

最 后 ， 我 们 返回 前 面 讨论 过 的 例子 程序 ， 以 此 来 总 结 我 们 的 讨论 。 对 该 例子 ， 我们 假设 
有 4 个 ASCII 数 字 ， 位 于 称 为 “ascii-val” 的 存储 缓冲 器 中 。 这 个 程序 将 ASCII 字 符 转 换 成 4 位 
十 六 进 制 数 ， 并 被 存 回 到 一 个 称 为 “hex_val” 的 存储 器 位 置 。 请 特别 注意 一 下 采用 ASL 指 令 [235 
移动 数位 的 方式 。 

这 个 程序 称 为 Get Value， 它 能 将 存储 器 中 的 4 个 ASCII 数 字 转 换 成 4 位 长 十 六 进 制 数 。 


雪灾 闪 突 二 二 妆 二 闪闪 内 闪闪 究 灿 内 闪闪 内 灾 妆 当 妆容 灾 突 家当 站 闪闪 帘 二 妆 妆 姜 室 妆 二 唐寅 病 闹 富 宙 二 妆 妆 妆 实 突 宙 突 有 闪闪 六 二 站 妆 病 实 宙 妆 妆 全 闪 安 入 克 突 
* Get_value 

* 将 4 个 ASCII 值 转换 成 4 位 十 六 进 制 数 字 

* 输入 参数 : 无 

* 假设 : 缓冲 器 、ascii val 包含 4 个 有 效 的 ASCII 字 符 ， 其 范围 为 0. . .9、A...F 或 a...f 


定 宽 击 测 韦 击 二 宣 定 填 遍 丙 守 言 宙 广 商 宙 识 识 高 遍 次 丙 次 刘 训 高 南光 实 宾 突 次 完 间 裕 裕 实 帘 实 商 宾 泊 宾 宙 宽 窒 半 交替 次 站 页 守 宙 直击 击 雪 吉 册 次 裕 凌 宕 宙 和 座 袖 轴 


* 系统 的 等 于 伪 指令 

mask EQU $00FF * 分 离 出 字 节 值 

stack EQU $B000 * 堆栈 指针 的 位 置 

* 程序 从 这 里 开始 
ORG $0400 * 程序 从 这 里 运行 

start LEA stack, SP * 建立 堆栈 指针 
CLR-W D7 * 我 们 将 用 到 这 个 寄存 器 
LEA ascii val,Al  * Al 指 向 存储 缓冲 器 
MOVE.B {A1)+,D0 * 取 第 一 个 字 节 
ANDI.W #mask, DO * 分 离 出 这 个 字 节 
jsr strip ascii * 去 掉 ASCII 码 





[oa 


198 


STOP 


#8,D0 

并 &@ ,DO 

D0,D7 
(Al1)}+,D0 
#mask,DO 
strip aacii 
#8,D0 

D0,D7 
(Al}+,D0O 
#mask,DO 
Strip ascii 
#4,DO 

D0,D7 
(Al1)+,D0 
#mask, DO 
strip ascii 
D0,D7 

D7, (A1)+ 
#$2700 
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* 左 移 8 位 

* 左 移 4 位 

* 将 这 些 位 装 到 D7 
* 取 下 一 个 字 节 

* 分 离 出 这 个 字 节 


窒 


和 


为 


和 


稀 


二 


和 和 


去 掉 ASCII 码 

左 移 8 位 

加 下 一 个 十 六 进 制 数字 
取 下 一 个 字 节 

分 离 出 这 个 字 节 

去 掉 ASCII 码 

左 移 4 位 

加 下 一 个 十 六 进 制 数 字 
取 下 一 个 字 节 ， 指 向 con_val 
分 离 出 这 个 字 节 

去 掉 ASCII 码 

加 最 后 一 个 十 六 进 制 数字 
存 转换 结果 

返回 到 模拟 器 


突 突 认可 二 兴 容 容 闪 家 二 雪崩 内 闪闪 安室 突 灾 灾 闪 窑 突 室 妆 商 禄 妆 突 突 兴 站 雪 究 内 安 灾 业 妆 窑 当月 灾 汪汪 安 究 突 必 病 家 窒 窑 帘 交 业 宙 容 突 究 交 症 病 风光 闪光 业 滞 


堵 路 革 站 


从 数字 0~9 
输入 参数 ， <D0> = ASCII 码 


子 程 序 : strip_ascii 


a~f 或 A~F 中 除去 ASCII 码 


* 返回 参数 ; D0.B = 数字 0...F， 返 回 00...0F 


* 使 用 的 内 部 寄存 器 : D0 


* 假设 D0 包含 $30~$39、$41~46、$61~66 


安 突 闪闪 安 肖 认 容 认 容 内 安 兴 突 究 灾 妆 语 窒 宙 究 灾 窑 灾 容 站 窑 突 祷 宙 究 内 六 容 闪 胡 究 突 闪闪 六 内 生火 容 闪 认 容 六 内 实 实 窒 室 灾 闪闪 家 帘 容 妆 室 妆容 实 灾 寅 病 汤 


strip ancii CMP.B 


SUub37 


sub30 
ret_sa 


* 数据 


ascii_val 


con val 


算术 指令 


BLE 


ADD (加 二 进 制 数 ) 
将 源 操作 数 和 目的 操作 数 相 加 ， 并 将 结果 放 入 目的 操作 数 。ADD 指 令 的 源 操作 数 或 目的 
操作 数 中 有 一 个 必须 是 数据 寄存 器 。 换 句 话 说， 你 不 能 直接 将 两 个 存 于 存储 器 中 的 数据 加 在 
一 起 ， 操 作 数 之 一 必须 在 数据 寄存 器 中 。 事 实 上 ， 只 有 MOVE 指 令 被 设计 成 其 两 个 有 效 地 址 都 
可 以 是 存储 器 地 址 。 
让 我 们 做 一 个 例子 。 假 设 在 执行 ADD 指 令 之 前 ，<D2> = $12345678, <D3> = $5F02C332 


#$39,D0 
gub30 

#$46,D0 
Bub37 

#$57,D0O 
ret_ sa 
#$37,D0 
ret_sa 
#$30,D0 


$31,$41,$30,$30 
1 


$400 


ADD.B 


入 法 着 共生 


它 在 0-9 的 范围 内 吗 ? 


它 是 一 个 数字 
它 是 A. . .FF 吗 ? 
它 是 A...F 
它 是 a f 
返回 

去 掉 37 

返回 

去 掉 30 

返回 

测试 值 S1RA00 
将 它 存 到 这 里 


D2,D3 


加 法 指令 执行 后 ，<D2> = $12345678, <D3> = $5F02C3AA 
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对 条 件 码 有 什么 影响 ? 

。N=1; 负 标 志 : 第 7 位 是 1， 所 以 结果 假定 为 负 。 

。C=0: 进位 标志 : 从 第 7 位 没有 产生 进位 。 

。X=0: 扩展 标志 用 于 某 些 操作 ， 所 受 影响 通常 与 进位 标志 类 似 。 737 

。Z=0: 零 标志 : 非 零 结果 。 

。V=1: 溢出 标志 : 这 是 需要 慎重 考虑 的 ! 目的 寄存 器 D3 的 第 7 位 变化 了 ， 所 以 可 能 遇 到 

了 溢出 条 件 。 

ADDA (加 地 址 ) 

将 数据 加 到 一 个 地 址 寄存 器 。 只 允许 字 操 作 和 长 字 操 作 ， 条 件 码 不 受 影响 。 

ADDI (加 立即 数 ) 

将 数字 加 到 数据 寄存 器 或 存储 器 。 人 允许 字 节 操作 、 字 操作 或 长 字 操作 。 考 虑 一 下 这 个 问 
题 ， 如 果 <D2> = $25C30F7， 执 行 下 面 这 两 条 指令 的 结果 是 什么 ? 注意 它们 的 不 同 仅 在 于 操 
作 的 大 小 。 为 核对 你 的 答案 ， 写 一 个 测试 程序 并 在 模拟 器 中 执行 。 

代码 实例 


ADDI.E #$10,D2 * <D2> = ??, C= ?? 
ADDI.W #$10,D2 * <D2> = ??, C= ?? 


CLR (对 一 个 操作 数 清 零 ) 

CLR 指 令 可 用 于 字 节 、 字 和 长 字 。 除 了 X 的 所 有 条 件 码 都 受 影响 。 

CMP (将 数据 与 一 个 数据 寄存 器 进行 比较 ) 

CMP 指 令 根 据 结果 设置 条 件 码 。 这 条 指令 是 从 目的 操作 数 中 减 去 源 操 作 数 ， 但 不 将 结果 
放 回 到 目的 操作 数 。 因 此 ， 哪 个 操作 数 也 没有 改变 ， 只 有 条 件 码 标志 受到 了 影响 。 


9.7 68000 指 令 总 结 


我 们 就 不 再 继续 艰难 地 逐条 学 习 68K 指 令 集中 的 各 条 指令 了 ， 让 我 们 按 功能 分 组 对 指令 进 
行 简要 地 总 结 。 


数据 传输 指令 总 结 
EXG 寄存 器 交换 
LEA 装 入 有 效 地 址 
LINK 链接 和 分 配 
MOVE 移动 数据 
MOVEA 移动 地 址 
MOVEM 移动 多 个 寄存 器 
MOVEP : 移动 外 设 数 据 
MOVEQ 快速 移动 
PEA 有 效 地 址 压 栈 
SWRP 半 寄 存 器 交换 
UNLK 解除 链接 





某 些 数据 传输 指令 如 LINK 和 UNZLK 看 起 来 可 能 会 很 陌生 ， 这 些 是 特殊 用 途 的 指令 ， 仅 用 
于 支持 高 级 语言 。 我 们 将 在 本 章 的 后 面 更 详细 地 讨论 这 些 指令 。 











算术 指令 总 结 
ADD 加 二 进 制 数 
ADDA 加 地 址 
ADDI 加 立即 数 
ADDQ 快速 加 
CLR 操作 数 清 零 
CMP 比较 
CMPI 立即 数 比较 
CPM 存储 器 比较 
DIVS 带 符 号 数 除 
DIVU 无 符号 数 除 
MULS 带 符号 数 乘 
NEG 取 反 
NEGX 带 X 取 反 
SUB 减 二 进 制 数 
SUBA 减 地 址 
SUBI 减 立即 数 
SUBQ 快速 减 
SUBX 带 X 减 
TAS 测试 和 置 位 
TST 测试 
EXT 扩展 符号 
程序 控制 指令 总 结 
Bec 根据 条 件 码 (cc) 标志 状态 转移 
DBcc 递减 并 根据 cc 转移 
Scc 设置 cc 
BRA 总 是 转移 
BSR 转移 到 子 程序 
JMP 无 条 件 跳 转 
JSR 跳 转 到 子 程序 
RTR 返回 和 恢复 
RTS 从 子 程序 返回 
逻辑 和 移 位 指令 总 结 
AND 逻辑 与 
ANDI 对 立即 数 与 
OR 逻辑 或 
ORI 对 立即 数 或 
EOR 异 或 
EORTI 对 立即 数 异 或 
NOT 逻辑 补 
ASL 算术 左 移 
ASR 算术 右 移 
LSL 逻辑 左 移 
LSR 逻辑 右 移 
ROL 循环 左 移 
ROR 循环 右 移 
ROXL 带 扩展 的 循环 左 移 
ROXR 带 扩展 的 循环 右 移 


一 一 ”oo 人 人 人 一、 
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特权 指令 总 结 
ANDI SR 将 立即 数 加 到 状态 寄存 器 
EORI SR 将 立即 数 异 或 到 状态 寄存 器 
MOVE SR 移 人 /移出 状态 寄存 器 
MOVE USP 移入 /移出 USP 
RESET 复位 处 理 器 
RTE 从 异常 返回 
STOP 停止 处 理 器 
CHK 检验 寄存 器 
ILLEGAL 强加 一 个 非法 指令 异常 
TRAP 陷阱 调用 
TRAPV 溢出 时 陷阱 调用 
ANDI CCR 将 立即 数 与 到 条 件 码 寄存 器 
ORI CCR 将 立即 数 或 到 条 件 码 寄存 器 
EORI CCR 将 立即 数 异 或 到 CCR 
MOVE CCR 移 人 /移出 CCR 
NOP 无 操作 一 一 不 做 任何 事 
位 操作 指令 总 结 

BCHG 位 改变 

BCLR 位 清 零 

BSET 置 位 

BTST - 位 测试 

二 进 制 编码 的 十 进 制 数 (BCD) 指令 总 结 

ABCD 加 BCD 数 

NBCD 取 反 BCD 数 

SBCD 减 BCD 数 


BCD 指 令 需 要 解释 一 下 。 它 们 是 计算 机 早期 的 遗产 ， 当 时 很 多 仪器 仍 用 数字 逻辑 电路 设 
计 ， 这些 电 路 计算 出 结果 并 将 其 显示 为 十 进 制 数 ， 即 使 计算 时 用 的 是 二 进 制 数 。 一 个 BCD 数 
与 在 0 到 9 范围 内 的 4 位 十 六 进 制 数 相同 。 当 计数 从 9 到 A 时 ，BCD 数 将 产生 一 个 进位 ， 并 且 数 
字 返 回 到 0。 换 名 话说， 就 是 用 基数 10 而 不 是 基数 16 来 计数 。 这 些 指令 现今 已 经 很 少 使 用 了 。 

如 你 所 见 ， 我 们 有 相当 多 种 类 的 68K 指 令 可 用 来 解决 广泛 的 真实 世界 的 编程 问题 。68K 指 
令 集 体系 结构 已 经 历 了 时 间 的 考验 ， 而 且 正在 被 设计 到 新 的 产品 中 。 很 多 设计 是 用 于 管理 操 
作 系 统 之 下 的 应 用 的 ， 另 一 些 设计 是 为 了 支持 高 级 语言 的 ， 还 有 一 些 是 用 于 处 理 程序 中 断 的 。 
在 对 汇编 语言 编程 的 介绍 中 ， 我 们 对 此 已 经 讨论 了 若干 次 。 重 要 的 是 ， 首 先 用 你 知晓 的 指令 
和 寻 址 模式 轻松 自如 地 解决 算法 ， 然 后 再 向 更 有 效率 (也 许 更 困难 ) 的 指令 和 寻 址 模式 过 渡 。 
事实 上 ， 一 贯 地 使 用 相对 少量 的 指令 绝 不 表示 专业 程度 低 。 在 下 一 课 你 将 会 看 到 ， 只 用 全 部 
指令 的 一 部 分 来 解决 大 多 数 问题 的 事实 导致 了 一 种 现代 计算 机 体系 结构 的 产生 ， 就 是 精简 指 
令 集 计算 机 ， 即 RISC。 


9.8 用 TRAP #15 指 令 模 拟 l/O 


包含 这 部 分 内 容 的 原因 是 我 们 需要 能 用 68K 模 拟 器 写 出 有 意义 的 程序 。 迄 今 我 们 看 到 和 和 写 
出 的 程序 都 是 独立 的 ， 没 有 任何 与 用 户 交 互 的 功能 。 这 样 的 计算 机 程序 对 学 习 体 系 结构 来 说 
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是 很 好 的 ， 但 在 真实 世界 中 它们 的 用 处 极其 有 限 。 为 了 使 一 个 计算 机 有 用 ， 我 们 就 必须 能 与 
它 交 互 。 在 这 一 小 节 中 我 们 将 向 你 介绍 模拟 器 的 一 个 非常 有 用 的 特征 ， 就 是 VO 程序 的 TRAP 
#15 系 列 。 

在 前 面 章节 中 你 看 到 过 一 个 称 为 zRAP 的 指令 。TRRP 指 令 就 像 一 个 软件 产生 的 中 断 ， 当 
处 理 器 执行 一 个 TRAP 指 令 时 ， 它 将 从 向 量 表 中 的 固定 位 置 自动 获得 TRAP 地 址 ， 将 返回 地 址 
放 到 堆栈 上 ， 并 在 新 的 位 置 开 始 进行 处 理 。TRAP #15 只 不 过 是 异常 向 量 表 中 TRAP 位 置 列表 
中 的 一 个 位 置 ， 异 常 向 量 表 存 储 在 从 $080 到 $0BC 的 区 域 中 ， 由 处 理 器 维护 。 

如 果 你 进入 68K 模 拟 器 的 Teesside 版 本 ， 并 键入 “HE” 来 响应 提示 符 ， 你 将 进入 到 帮助 
程序 中 。TRAP #15 指 令 就 是 模拟 器 设计 者 所 开发 的 便于 用 户 和 程序 之 间 进 行 MO 操 作 的 一 种 
方式 。 你 可 以 通过 学 习 与 E68K 程 序 一 起 提供 的 帮助 程序 来 获得 TRAP #15 指 令 的 一 些 知识 。 
或 者 ， 你 也 可 以 在 Clements 的 书 中 读 到 关于 TRAP #15 的 功能 。 

记 住 ，TRAP #15 指 令 是 模拟 器 的 产物 ， 它 是 被 设计 用 来 使 模拟 器 和 用 户 之 间 能 发 生 IO 
操作 的 。 如 果 你 真 要 写 IO 程 序 ， 你 可 能 要 做 一 些 不 同 的 事情 ， 但 很 多 事情 是 一 样 的 。 

与 TRAP #15 指 令 相 关联 的 是 各 种 任务 ， 每 个 任务 都 有 编号 。 与 每 个 任务 关联 的 是 一 个 
应 用 程序 员 接 口 (application programmer's interface) ， 即 API， 用 来 解释 该 任务 如 何 完成 其 工 
作 。 例 如 ，task #0 将 一 个 字符 串 显示 到 显示 器 上 并 加 入 一 个 换行 符 ， 使 得 光标 前 进 到 下 一 行 
的 开始 处 。 为 了 使 用 task 如 ， 你 必须 建立 下 面 的 寄存 器 〈 这 就 是 API) : 

。 D0 以 字 节 形式 装载 任务 编号 。 

。A1 装 载 字 符 串 开始 处 的 存储 地 址 。 

。D1 装 载 要 打印 字符 串 的 长 度 。 

一 旦 建立 了 这 三 个 寄存 器 ， 你 在 程序 中 将 TRAP #15 作 为 指令 调用 ， 你 的 消息 就 会 出 现 
在 模拟 器 的 显示 屏 上 。 这 样 ，TRAP 指 令 就 成 了 68K 模 拟 器 和 PC 操作 系统 之 间 的 接口 。 下 面 的 
这 个 样 例 程序 示意 出 了 它 是 如 何 工 作 的 。 为 输出 字符 串 “Hello world!”， 你 可 以 采用 如 下 的 
代码 片段 : 

“Hello World!” 例 子 


并 审 十 下 容 寅 守 二 家 二 直击 竟 帘 寥 裕 次 容 家 容 丙 容 容 灾 突击 测 调 页 刘 下 让 圳 识 刘 让 识 实 实 灾 守 守 福 袜 冯 开业 寺 让 


* 将 字符 串 显示 到 显示 器 的 测试 程序 


实 突 突 内 灾 祷 窑 办 灾 实 窑 突 家 灾 突 实 兴 二 实 当 守 妆 汪 宙 妆 妆 宙 六 妆 汪 灾 灾 实 窑 闪 当 突 安 当 二 实业 广 六 次 六 闪闪 交 


OPT CRE 

taskO0 EQU 00 
ORG $400 

start MOVE .3 #task0,DO * 将 任务 编号 装 人 到 D0 
LEA string,Al * 取 字 符 串 地 址 
MOVE .W str_len,D1 * 字符 串 长 度 在 D1 中 
TRAP | #15 * 开始 做 
STOP #$2700 * 回 到 模拟 器 

* 数据 区 

string DC.B ‘Hello world’ * 消息 存储 在 这 里 

str_len DC.wW str_len-string * 到 字符 串 长 度 
END $400 

看 这 一 行 : 


str len DC.W str_len-string  * 取 字 符 申 长 度 
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将 会 发 生 什 么 情况 ? 我 们 正在 让 汇编 器 为 我 们 做 一 些 工作 ， 汇 编 器 通过 将 字符 串 后 第 一 个 地 
址 减 去 字符 串 起 始 地 址 (标记 为 “string”) 来 计算 字符 串 的 长 度 (标记 为 “str_len”)。 在 汇编 语 
言 中 ， 用 这 种 方法 计算 程序 中 两 个 位 置 (存储 器 位 置 ) 之 间 的 距离 也 是 一 种 相当 常用 的 技术 。 
当 你 在 C++ 中 减 指针 时 ， 你 做 的 也 是 同一 件 事情 。 

除了 没有 “换行 ” 符 ，task 共 1 和 task 并 0 几乎 是 等 同 的。 为 用 户 提供 提示 符 来 输入 信息 
是 很 方便 的 ， 所 以 ， 你 会 使 用 task #1 而 不 是 task 共 0 来 给 出 提示 。 

还 有 ， 你 也 许 想 从 用 户 那里 得 到 信息 。 比 如 他 们 想 在 哪里 运行 存储 器 测试 ， 要 用 什么 测 
试 码 。 你 可 能 还 要 问 他 们 是 否 要 用 不 同 的 测试 码 再 进行 测试 。 

task 并 2 是 另 一 个 非常 有 用 的 尔 数 。 在 执行 这 条 指令 时 ， 模 拟 器 会 等 待 你 从 终端 输入 一 个 
以 ENTER 键 结束 的 字符 串 。 模 拟 器 会 将 你 输入 的 字符 串 放 和 人 Al 所 指 的 一 个 存储 缓冲 器 中 。 

TRAP #15 有 很 多 功能 程序 。 理 解 如 何 使 用 它们 的 最 好 途径 就 是 首先 进行 阅读 ， 然 后 写 
几 个 小 的 测试 程序 来 检验 你 学 到 的 知识 。 


9.9 编译 器 和 汇编 器 


到 现在 为 止 ， 我 们 一 直 与 C 和 C++ 这 样 的 高 级 语言 保持 距离 。 我 们 确实 曾 短暂 地 离开 主题 
看 了 一 下 如 何 用 汇编 语言 来 模仿 C 语 言 的 一 些 典 型 的 循环 结构 ， 但 在 大 部 分 篇 幅 中 ， 我 们 还 是 
分 开 介绍 的 。 

然而 ， 我 们 不 应 该 党 得 奇怪 的 是 ， 即 使 我 们 用 C++ 写 程 序 ， 我 们 也 可 以 用 汇编 语言 调试 程 
序 。 而 且 ， 还 可 以 从 计算 机 体系 结构 的 角度 来 理解 为 什么 会 存在 某 些 指 令 和 寻 址 方式 。 完 整 
地 学 习 编 译 器 如 何 工 作 和 如 何 利用 计算 机 的 指令 集体 系 结构 超出 了 本 书 的 范围 ， 但 简要 地 看 
一 看 编译 器 如 何 工作 并 设 有 害处 ， 所 以 ， 我 们 将 要 了 解 一 下 C 语 言 的 交叉 编译 器 是 如 何 将 C 的 
源 文件 转换 成 汇编 语言 的 。 

考虑 下 面 这 个 简单 的 C 程 序 : 


int funct(int,int *) ; 
void main() 


int i = 0, aVvar = 5555, jj ; 
1++ 了 

j = funct(i, &avar ); 

j++ ; 


} 


int funct( int var, int * aPtr ) 
{ 
return var + *aPtr }; 


) 

这 里 我 们 声明 了 i、j、aVar 这 3 个 变量 ， 并 做 了 一 些 简 单 的 操作 。 要 注意 的 是 ， 我 们 向 函 
数 funct 传 送 了 两 个 变量 。 一 个 变量 是 通过 值 传送 的 ， 另 一 个 变量 aVar 是 通过 引用 传送 的 。 该 
程序 将 用 68000 交 又 编 译 器 进行 编译 ， 该 交 又 编译 器 是 由 HP 公司 在 几 年 前 开发 的 ， 而 且 是 与 
其 嵌入 式 软件 开发 工具 一 起 使 用 的 。 编 译 器 生成 汇编 语言 源 文件 ， 然 后 由 68000 汇 编 器 进行 汇 
编 ， 该 汇编 器 也 是 由 HP 公司 开发 的 。 

下 面 就 是 编译 器 为 该 程序 生成 的 68000 汇 编 语 言 代 码 。 实 际 的 汇编 语言 指令 或 伪 指 令 用 灰 
色 字 体 显示 。 我 还 加 入 了 灰色 框 来 解释 编译 器 为 什么 做 和 做 了 些 什 么 。 这 个 汇编 语言 源 文件 
接着 就 将 被 68000 汇 编 器 进行 汇编 并 产生 目标 文件 。 现 代 C 或 C++ 编 译 器 通常 会 跳 过 汇编 语言 
源 文件 的 生成 过 程 而 直接 形成 目标 代码 。 但 是 ， 我 们 的 意图 是 用 这 种 “老式 的 ”编译 器 来 确 
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切 地 看 看 所 发 生 的 事情 。 


CHIP 68000 NAME test3 





* as 


BRW, FRL, NOI , NOW 


。 为 调用 运行 时 的 程序 库 而 散 的 宏 定义 
每 次 调用 的 字 节 = 6 


类 
* 





CALL MACRO routine 
XREF routine 
Se (routine,PC) 


243 ER 


SECT os 


ORG $400 
LEA $1000,SP . 
int funct(int,int *) ; 
ci main() 


"i AG6,#-4 
MOVE.L D3,-(A7) * 保存 D3 的 当前 值 


MOVE.L D2,-(A7) * 保存 D2 的 当前 值 
MOVEQ  #$FF,D1 * 不 完全 确信 为 什么 
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MOVE.L D1,(-4,A6) 


* 这 就 将 FF 放 人 到 了 _main 堆 栈 帧 的 底部 
MOVEQ  #$FF,D2 * ' 谁 知道 ? 
MOVE.L D2,D3 * 问 : 坟 





Savar SET -4 





MOVE.L #5555, (S_aVar+0,A6) 


4 int i = 0, avar = 5555, j ; 
5 i++ 了 


ADDQ.L #1,D2 


入 6 j = funct(i, gaVar ); 





LEA (S_aVar+0,A6),AO0 
PEA (A0) 
MOVEA.L D2,A0 
PEA (A0) 
JSR (_funct+0,PC) 
ADDQ.L #8,SP * 国 数 越界 
MOVE.L DO,D3 * D0 是 JSR 的 返回 寄存 器 
内 时 j++ ; 
ADDQ.L #1,D3 * 这 是 j++ 


functionExit1 NOP 
MOVE.L (A7)+,D2 * 恢复 D2 
MOVE.L (A7)+,D3 * 恢复 D3 
UNLK A6 * 释放 堆栈 帧 


returnLabell1 RTS 
: NOP 
NOP 
NOP 
多 9 int funct( int var, int * apPtr ) 
10 { 


XDEF _funct 
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_funct 
LINK A6,#-0 
S_var SET 8 
S_apPtr SET 12 
和 return Var + *aPtr }; 





MOVE.L (S_aPtr+0,A6),A0 

MOVE.L AO0,D1 

BEQ.S LO _ APtrChk 

MOVEQ #$FF,DO 

CMP.L DO,D1 

BNE.S LO BPtrChk 
L0_APtrChk 

CALL ptrfault 





ptrFault RTS 


LO_PtrIinfo 
DC.L 11 
DC.B ‘test3.c’ 


DC.B 0 





ALIGN 2 
LO BPtrChk 
MOVE.L (S_ var+0,A6),D0O 
. ADD.L (A0),DO 
BRA functionExit2 | 





NOP * 这 是 函数 调用 的 返回 

UNLK 及 6 * 释放 堆栈 帧 eturnLabe12 
RTS * 这 是 程序 的 返回 

END $400 


上 面 代码 的 运行 过 程 就 是 编译 器 如 何 工作 的 粗略 一 曾 。 从 汇编 语言 的 角度 来 看 ， 一 些 指 
令 序列 没有 任何 意义 。 然 而 ， 我 们 必须 记 住 这 样 的 事实 ， 就 是 编译 器 只 是 一 个 程序 ， 它 必须 
能 处 理 C 语 言 的 所 有 可 能 情况 。 这 意味 着 一 旦 为 进行 数据 处 理 而 确立 了 内 务 管理 规则 ， 这 些 规 
则 就 永远 要 遵守 ， 即使 它们 在 特定 情况 下 是 不 必要 的 和 元 余 的 。 所 以 你 就 会 明白 为 什么 手工 
编写 的 汇编 代码 常常 能 使 性 能 提高 。 

现在 我 们 就 可 以 问 问 关于 $65 536 的 问题 了 。 它 能 工作 吗 ? 上面 的 汇编 代码 正确 地 运行 了 
原始 的 C 代 码 了 吗 ? 让 我 们 看 一 下 。 我 们 将 在 模拟 器 中 实际 地 运行 这 个 代码 。 rei 
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栈 的 行为 ， 因 为 那里 是 实际 操作 的 地 方 。 模 拟 器 代码 列 在 左边 ， 堆 栈 状态 列 在 右边 。 我 们 用 “47] 
深 灰 色 显 示 堆 栈 帧 指针 的 当前 值 A6， 用 浅 灰 色 显示 堆栈 指针 SP。 图 示 如 下 : 


PC=000400 SR=2000 SS=00A00000 US=00000000 X=0 
A0=00000000 AL=00000000 A2=00000000 A3=00000000 N=0 
A4=00000000 A5=00000000 A6=00000000 A7=00A00000 Z=0 
DO0=00000000 D1=00000000 D2=00000000 D3=00000000 V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
---------- >LEA.L $1000, SP 

PC=000404 SR=2000 SS=00001000 US=00000000 X=0 
A0=00000000 AL=00000000 A2=00000000 A3=00000000 N=0 
A4=00000000 A5=00000000 A6=00000000 A7=00001000 Z=0 
DO=00000000 D1=00000000 D2=00000000 D3=00000000 V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
---------- >LINK A6,#-4 

PC=000408 SR=2000 SS=00000FF8 US=00000000 X=0 
A0=00000000 A1l=00000000 A2=00000000 A3=00000000 N=0 
A4=00000000 AS5=00000000 A6=00000FFC A7=00000FF8 2Z=0 
D0=00000000 D1=00000000 D2=00000000 D3=00000000 V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
---------- >MOVE.L D3,-(SP) 





PC=00040A SR=2004 SS=00000FF4 US=00000000 X=0 
A0=00000000 A1=00000000 A2=00000000 A3=00000000 N=0 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FF4 2Z=1 
D0=00000000 D1=00000000 D2=00000000 D3=00000000 V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
---------- >MOVE.L D2,- (SP) 


以 上 的 代码 部 分 显示 出 堆栈 指针 被 置 为 地 址 $1000， 并 用 LINK 指 令 生成 了 局 部 堆栈 帧 。 

下 面 就 是 发 生 的 情况 : 
。 存 储 器 从 $0FFD 到 $1000 的 位 置 存放 寄存 器 A6 的 当前 值 。 
。4 个 字 节 被 保存 在 堆栈 上 ，A6 变 成 这 些 字 节 的 堆栈 指针 ，A6 被 置 为 $0FFC。 248 
。 系统 堆栈 指针 A7 重 置 为 0FF8， 在 局 部 堆栈 之 下 。 
接 下 来 ,将 D2 和 D3 压 入 堆栈 ， 因 为 它们 将 要 被 用 到 。 
PC=00040C SR=2004 SS=00000FF0 US=00000000 X=0 
A0=00000000 A1l=00000000 A2=00000000 A3=00000000 N=0 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FFO0 2Z=1 


DO=00000000 D1=00000000 D2=00000000 D3=00000000 V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 








PC=00040E SR=2008 SS=00000FF0 US=00000000 X=0 
A0=00000000 AL=00000000 A2=00000000 A3=00000000 N=1 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FFO0 z=0 
DO=00000000 D1=FFFFFFFF D2=00000000 D3=00000000 V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
---------- >MOVE.L D1,-4(A6) 

C=000412 SR=2008 SS=00000FF0 US=00000000 X=0 
A0=00000000 A1=00000000 A2=00000000 A3=00000000 N=1 
A4=00000000 AS5=00000000 A6=00000FFC A7=00000FFO0 Z=0 
DO=00000000 D1=FFFFFFFF D2=00000000 D3=00000000 V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 





PC=000414 SR=2008 SS=00000FF0 US=00000000 X=0 
A0=00000000 Al=00000000 A2=00000000 A3=00000000 N=1 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FF0 Z=0 
DO=00000000 D1=FFFFFFFF D2=FFFFFFFF D3=00000000 V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
一 一 一 一 一 一 一 一 一 一 >MOVE .L D2,D3 
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注意 突出 显示 的 指令 MOVE.L D1, -4(A6)， 这 是 一 个 带 偏 移 地 址 的 寄存 器 间接 寻 址 的 例 
子 。 编 译 器 使 用 A6 作 为 堆栈 指针 将 数据 放置 到 了 其 局 部 堆栈 帧 。 

堆栈 帧 只 是 变量 存储 区 域 ， 是 编译 器 在 堆栈 上 为 其 函数 变量 建立 的 。 余 下 的 模拟 结果 没 
有 提供 任何 细节 ， 所 以 现在 给 大 家 留 一 个 习题 : 请 遍历 该 指令 和 堆栈 条 件 以 确信 其 确实 像 预 
期 那样 工作 了 。 


PC=000416 SR=2008 SS=00000FF0 US=00000000 X=0 
A0=00000000 Al=00000000 A2=00000000 A3=00000000 N=1 a 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FF0 Z=0 
D0=00000000 D1=FFFFFFFF D2=FFFFFFFF D3=FFFFFFFF V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
---------- >MOVEQ #0,D2 
PC=000418 SR=2004 SS=00000FF0 US=00000000 X=0 
A0=00000000 Al=00000000 A2=00000000 A3=00000000 N=0 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FF0 2Z=1 
D0=00000000 D1=FFFFFFFF D2=00000000 D3=FFFFFFFF V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
人 >MOVE.L #5555,-4(A6) 

PC=000420 SR=2000 SS=00000FF0 US=00000000 x=0 1000[00|00|00|00| 
A0=00000000 AL=00000000 A2=00000000 A3=00000000 N=0 OFFC BOI To0 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FF0 Z=0 OFF8| 00|00|15|B3 
D0O=00000000 D1=FFFFFFFF D2=00000000 D3=FFFFFFFF V=0 OFF4 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 oFF0|00|00|00|00, 
a >ADDQ.L #1,D2 

PC=000422 SR=2000 SS=00000FF0 US=00000000 X=0 
A0=00000000 Al=00000000 A2=00000000 A3=00000000 N=0 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FF0 Z=0 
D0O=00000000 D1=FFFFFFFF D2=00000001 D3=FFFFFFFF V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
i >LEA.L -4(A6),A0 

PC=000426 SR=2000 SS=00000FF0 US=00000000 X=0 
A0=00000FF8 Al=00000000 A2=00000000 A3=00000000 N=0 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FF0 Z=0 
D0O=00000000 D1=FFFFFFFF D2=00000001 D3=FFFFFFFF V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
后 区 区 >PEA (RO) 

PC=000428 SR=2000 SS=00000FEC US=00000000 X=0 
A0=00000FF8 AL=00000000 A2=00000000 A3=00000000 N=0 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FEC Z=0 
D0O=00000000 D1=FFFFFFFF D2=00000001 D3=FFFFFFFF V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
一 一 一 一 一 一 一 一 一 一 >MOVEA.L D2,A0 

PC=00042A SR=2000 SS=00000FEC US=00000000 X=0 
A0=00000001 AL=00000000 A2=00000000 A3=00000000 N=0 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FEC Z=0 
D0O=00000000 D1=FFFFFFFF D2=00000001 D3=FFFFFFFF V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
>PEA (A0) 

PC=00042C SR=2000 SS=00000FE8 US=00000000 X=0 
A0=00000001 Al=00000000 A2=00000000 A3=00000000 N=0 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FE8 Z=0 
D0=00000000 D1=FFFFFFFF D2=00000001 D3=FFFFFFFF V=0 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 C=0 
---------- >JSR 28(PC) 


[oo[oo[oo| 
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C=00044A SR=2000 SS=00000FE4 US=00000000 
A0=00000001 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 AS5=00000000 A6=00000FFC A7=00000FE4 
DO=00000000 D1=FFFFFFFF D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
一 一 一 ”一 ”一 一 一 一 >LINK A6,#0 

PC=00044E SR=2000 SS=00000FE0 US=00000000 
A0=00000001 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FEO0 A7=00000FEO0 
DO=00000000 D1=FFFFFFFF D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
---------- >MOVEA.L 12(A6),AO0 

PC=000452 SR=2000 SS=00000FE0 US=00000000 
AO0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FE0 A7=00000FEO0 
DO=00000000 D1=FFFFFFFF D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
---------- >MOVE.L AO0,D1 

PC=000454 SR=2000 SS=00000FE0 US=00000000 
A0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FEO0 A7=00000FEO0 
DO=00000000 D1=00000FF8 D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
---------- >BEQ.S $0000045C 

PC=000456 SR=2000 SS=00000FE0 US=00000000 
AO0=00000FF8 A1l=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FE0 A7=00000FEO0 
D0O=00000000 D1=00000FF8 D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
---------- >MOVEQ #-1,D0 

PC=000458 SR=2008 SS=00000FE0 US=00000000 
A0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FE0 A7=00000FEO0 
DO=FFFFFFFF D1=00000FF8 D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
~--------- >CMP .LL DO,D1 

PC=00045A SR=2001 SS=00000FE0 US=00000000 
AO0=00000FF8 A1l=00000000 A2=00000000 A3=00000000 
A4=00000000 AS5=00000000 A6=00000FE0 A7=00000FEO0 
DO=FFFFFFFF D1=00000FF8 D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
---------- >BNE.S $00000470 

PC=000470 SR=2001 SS=00000FE0 US=00000000 
A0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FE0 A7=00000FEO 
DO=FFFFFFFF D1=00000FF8 D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
---------- >MOVE.L 8(A6),D0 

PC=000474 SR=2000 SS=00000FE0 US=00000000 
A0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FE0 A7=00000FE0 
DO=00000001 D1=00000FF8 D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
---------- >ADD.L (A0),DO 

PC=000476 SR=2000 SS=00000FE0 US=00000000 
AO0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FE0 A7=00000FEO0 
DO=000015B4 D1=00000FF8 D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
---------- >BRA.L $0000047A 

PC=00047A SR=2000 SS=00000FE0 US=00000000 
A0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FE0 A7=00000FEO0 
DO=000015B4 D1=00000FF8 D2=00000001 D3=FFFFFFFF 
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D4=00000000 D5=00000000 D6=00000000 D7=00000000 


PC=00047C SR=2000 SS=00000FE0 US=00000000 

AO0=00000FF8 Al=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FE0 A7=00000FE0 
DO=000015B4 D1=00000FF8 D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 


PC=00047E SR=2000 SS=00000FE4 US=00000000 

AO0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 AS5=00000000 A6=00000FFC A7T=00000FE4 
DO=000015B4 D1=00000FF8 D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 


PC=000430 SR=2000 SS=00000FE8 US=00000000 
A0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 AS5=00000000 A6=00000FFC A7=00000FE8 
DO=000015B4 D1=00000FF8 D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
---------- >ADDQ .LL #8,SP 
PC=000432 SR=2000 SS=00000FF0 US=00000000 
AO0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FFO0 
DO=000015B4 D1=00000FF8 D2=00000001 D3=FFFFFFFF 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
---------- >MOVE .L D0,D3 
PC=000434 SR=2000 SS=00000FF0 US=00000000 


A0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 AS5=00000000 A6=00000FFC A7=00000FFO 
DO=000015B4 D1=00000FF8 D2=00000001 D3=000015B4 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
---------- >ADDQ.L #1,D3 


PC=000436 SR=2000 SS=00000FF0 US=00000000 

AO0=00000FF8 Al=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FFO 
DO=000015B4 D1=00000FF8 D2=00000001 D3=000015B5 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 


PC=000438 SR=2000 SS=00000FF0 US=00000000 
A0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FFO0 
DO=000015B4 D1=00000FF8 D2=00000001 D3=000015B5 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
---------- >MOVE.L (SP)+,D2 


PC=00043A SR=2004 SS=00000FF4 US=00000000 
AO0=00000FF8 A1l=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FF4 
DO=000015B4 D1=00000FF8 D2=00000000 D3=000015B5 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 
-~--------- >MOVE.L (SP)+,D3 


PC=00043C SR=2004 SS=00000FF8 US=00000000 

A0=00000FF8 A1l=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000FFC A7=00000FF8 
DO=000015B4 D1=00000FF8 D2=00000000 D3=00000000 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 


PC=00043E SR=2004 SS=00001000 US=00000000 

AO0=00000FF8 AL=00000000 A2=00000000 A3=00000000 
A4=00000000 A5=00000000 A6=00000000 A7=00001000 
DO=000015B4 D1=00000FF8 D2=00000000 D3=00000000 
D4=00000000 D5=00000000 D6=00000000 D7=00000000 


C=0 


X=0 
N=0 
ZzZ=0 
V=0 
c=0 


X=0 
N=0 
ZzZ=0 
V=0 
c=0 


X=0 
N=0 
z=0 
V=0 
C=0 


X=0 
N=0 
Z=0 
V=0 
C=0 


X=0 


N=0 
ZzZ=0 
V=0 
c=0 


X=0 
N=0 
Z=0 
V=0 
c=0 


X=0 
N=0 
Z=0 
V=0 
C=0 


X=0 
N=0 
Z=1 
V=0 
c=0 


X=0 
N=0 
Z=1 
V=0 
C=0 


X=0 
N=0 
Z=1 
V=0 
C=0 


oFrE0| 00|00| oF|FC| 
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你 可 能 奇怪 为 什么 最 后 一 条 指令 是 RTS。 如 果 这 个 程序 要 在 一 个 操作 系统 下 运行 (C 编 译 
器 的 预计 就 是 这 样 的 ) ， 那 么 ， 该 指令 会 将 控制 归还 给 操作 系统 。 

在 我 们 离开 68000 汇 编 语 言 并 继续 进入 到 其 他 体系 结构 之 前 ， 还 有 最 后 一 件 事情 要 讨论 ， 
就 是 指令 集 分 解 问题 。 我 们 已 经 从 指令 集 、 寻 址 模式 以 及 内 部 寄存 器 资源 等 角度 考察 了 体系 
结构 问题 ， 现 在 我 们 试图 将 这 些 与 我 们 对 状态 机 的 讨论 相关 联 ， 来 看 看 指令 的 编码 实际 上 是 
如 何 进 行 的 。 

将 机 器 语言 转换 回 到 汇编 语言 的 过 程 称 为 反 汇 编 (disassembly) 。 反 汇编 器 是 一 个 程序 ， 
用 于 检查 存储 器 中 的 机 器 代码 并 试图 将 其 转换 回 到 汇编 语言 ， 这 是 一 个 极其 有 用 的 调试 工具 ， 
事实 上 ， 多 数 调试 器 都 有 内 置 的 反 汇 编 特 性 。 

你 可 能 还 记得 ， 我 们 前 面 介 绍 汇编 语言 时 讲 到 过 ， 一 个 指令 的 第 一 个 字 称 为 操作 代码 字 
(opcode word)。 操 作 代码 字 包 含 一 个 操作 代码 ， 用 于 告诉 计算 机 要 做 什么 ， 它 还 包含 零 个 、 
一 个 或 两 个 有 效 地 址 域 (effective address field, EA) 。 有 效 地址 域 包含 编码 过 的 信息 ， 告 诉 处 
理 器 如 何 从 存储 器 中 取 回 操作 数 。 换 名 话说， 操作 数 的 有 效 地 址 是 什么 。 

你 已 知道 ， 一 个 操作 数 可 以 是 一 个 地 址 寄存 器 也 可 以 是 一 个 数据 寄存 器 。 操 作 数 可 处 于 
存储 器 中 ， 但 由 地 址 寄存 器 指向 它 。 考 虑 如 下 所 示 的 指令 形式 : 





操作 代码 目的 EA 源 EA 


DB15 DB12 DB11 DB6 DB5 DB0 





操作 代码 域 包含 从 DB12 到 DB15 的 4 个 位 ， 它 告诉 计算 机 这 是 一 条 移动 指令 ， 也 就 是 将 由 
源 EA 所 规定 的 存储 器 位 置 的 内 容 移动 到 由 目的 EA 所 规定 的 存储 器 位 置 中 。 此 外 ， 有 效 地 址 域 
进一步 被 分 解 为 一 个 3 位 的 模式 域 和 一 个 3 位 的 子 类 (寄存 器 ) 域 。 

这 个 信息 已 足够 告诉 计算 机 它 要 完成 指令 所 需要 知道 的 任何 事情 ， 但 操作 代码 本 身 不 一 
定 有 完成 指令 所 必需 的 所 有 信息 。 为 完成 指令 ， 计 算 机 也 许 要 再 访问 存储 器 一 到 两 次 来 取出 
关于 源 EA 或 目的 EA 的 额外 信息 。 如 果 我 们 回想 起 操作 代码 字 是 指令 的 一 部 分 ， 而 指令 必须 由 
微 代码 驱动 的 状态 机 进行 译 码 ， 这 就 开始 变 得 有 意义 了 。 一 旦 通过 对 操作 代码 字 进 行 译 码 而 
确立 了 适合 的 状态 机 序列 ， 如 果 必 要 的 话 ， 就 要 从 存储 器 中 取出 另外 的 操作 数 。 

例如 ， 假 设 源 EA 和 目的 EA 都 是 数据 寄存 器 。 换 句 话 说， 指令 是 : 

MOVE.W DO,D1 
由 于 源 和 目的 都 是 内 部 寄存 器 ， 处 理 器 就 不 需要 额外 的 信息 来 执行 指令 。 在 这 个 例子 中 ， 指 
令 的 长 度 和 操作 代码 的 长 度 一 样 ， 是 16 位 长 ， 即 一 个 字 的 长 度 。 
然而 ， 假 设 指 令 是 : 


MOVE.W #$00D0,D1 
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现在 ，## 号 告诉 我 们 源 EA 是 一 个 立即 操作 数 (16 进 制 数 $S00D0) ， 目 的 EA 仍 是 寄存 器 D1。 在 
该 例 中 ， 操 作 代码 告诉 我 们 源 是 一 个 立即 操作 数 ， 但 它 不 能 告诉 我 们 该 立即 操作 数 的 实际 值 。 


”计算 机 必须 再 到 存储 器 中 取 回 操作 代码 字 之 后 的 下 一 个 字 ， 这 就 是 数据 值 $S00D0。 如 果 这 条 


指令 处 于 存储 器 $1000 的 位 置 ， 则 操作 代码 字 将 占据 字 地 址 $1000， 而 操作 数 将 处 于 位 置 
$1002 。 

有 效 地 址 域 是 16 位 宽 的 域 ， 它 又 进一步 分 为 两 个 3 位 域 ， 分 别称 为 模式 (mode) 和 寄存 器 
(register) 。3 位 宽 的 模式 域 可 指定 8 种 可 能 的 寻 址 方式 之 一 ， 寄 存 器 域 可 指定 8 个 可 能 的 寄存 器 
之 一 ， 或 称 为 模式 域 的 一 个 子 类 (subclass)。 

MOVE 指 令 的 独特 性 在 于 其 有 两 个 可 能 的 有 效 地 址 域 ， 所 有 其 他 的 指令 可 能 只 包含 一 个 
有 效 地 址 域 。 你 开始 时 也 许 对 此 感到 奇怪 ， 但 是 你 将 会 看 到 ， 几 乎 所 有 其 他 采用 两 个 操作 数 
的 指令 都 必须 涉及 一 个 寄存 器 和 一 个 有 效 地 址 。 

让 我 们 将 注意 力 放 回 到 MOVE 指 令 。 如 果 我 们 完全 将 其 分 解 成 其 组 成 部 分 ， 则 将 如 下 所 示 ; 


0 0 大 小 目的 寄存 器 目的 模式 源 模式 源 寄存 器 


DB15 DBI4 DB13 DB12 DB1l1 DB10 DB9 DB8 DB7 DB6 DB5S DB4 DB3 DB2 DBl1 DB0 


子 类 只 用 于 模式 7 寻 址 模式 。 这 些 模式 是 : 


模式 7 寻 址 子 类 
绝对 字 000 
绝对 长 字 001 
立即 数 100 
带 位 移 的 PC 相对 : 010 
带 变 址 的 PC 相对 011 


你 可 能 已 经 注意 到 了 移动 到 地 址 寄存 器 (MOVEA) 指令 ， 并 疑惑 我 们 为 什么 还 需要 再 创 
造 一 个 需要 特殊 记忆 的 一 般 的 MOVE 指 令 。 首 先 ， 地 址 寄存 器 是 极其 有 用 的 重要 内 部 资源 ， 
有 地 址 寄存 器 就 意味 着 我 们 能 做 寄存 器 算术 操作 和 指针 操作 。 我 们 也 能 比较 寄存 器 的 值 并 根 
据 数据 的 地 址 做 决策 。 

MOVEA 指 令 是 一 个 更 标准 的 指令 类 型 ， 因 为 只 有 一 个 有 效 地 址 用 于 源 操 作 数 ， 而 上 且 的 操 
作 数 是 7 个 地 址 寄存 器 之 一 。 这 样 ， 目 的 模式 就 硬性 地 编码 为 地 址 寄存 器 。 然 而 ， 我 们 需要 创 
造 一 个 特殊 的 指令 用 于 MOVEA 操 作 ， 因 为 在 奇数 字 节 边界 取 字 是 一 个 非法 的 访问 ， 而 
MOVEA 指 令 防止 了 这 种 情况 的 发 生 。 





大 部 分 指令 呈现 如 下 的 形式 : 
操作 码 寄存 器 操作 模式 | 源 EA 或 目的 EA 
DB15 DB12 DB11 DB9 DB8 DB6 DB5 DB0 


操作 码 域 规定 指令 是 否 是 ADD、AND、CMP， 等 等 ,而 寄存 器 域 规定 哪 一 个 内 部 寄存 器 
是 操作 的 源 或 目的 。 操 作 模式 域 (op mode field) 是 一 个 新 术语 ， 它 为 指令 规定 了 8 种 细 分 情 
况 中 的 一 种 。 例 如 这 个 域 规定 ， 是 否 内 部 寄存 器 就 是 操作 的 源 或 目的 ， 以 及 是 否 大 小 是 字 节 、 
字 或 长 字 。 我 们 将 在 稍 后 看 到 这 些 情况 。 

单 操作 数 指令 如 CLR (将 目的 EA 的 内 容 置 为 0) 有 稍微 不 同 的 形式 : 
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操作 码 . 大 小 目的 EA 
DB15 DB8 DB7 DB6 DB5 DBO 


JMP ( 跳 转 ) 和 JSR ( 跳 转 到 子 程序 ) 也 是 单 操作 数 指令 。 两 个 指令 都 将 目的 EA 放 入 到 
了 程序 计数 器 ， 使 得 下 一 条 指令 从 新 位 置 取出 ， 而 不 是 序列 的 下 一 条 指令 。 在 PC 的 内 容 被 目 
的 EA 取代 之 前 ，JSR 指 令 也 将 自动 地 将 程序 计数 器 的 当前 值 放 入 到 堆栈 。 这 样 ， 返 回 位 置 就 
被 存 到 堆栈 中 。 

转移 指令 Bcc (根据 条 件 码 转移 ) 在 修改 PC 内 容 使 下 一 条 指令 不 按 序 取 出 这 方面 类 似 于 
跳 转 指令 。 然 而 ， 转 移 指令 在 两 个 基本 方式 上 有 所 不 同 : 

1. 没有 有 效 地 址 。 位 移 值 会 被 加 入 到 PC 的 当前 内 容 中 ， 使 得 新 值 由 一 个 当前 值 的 正和 移动 
或 负 移动 来 确定 。 因 此 ， 位 移 是 一 个 相对 跳 转 ， 而 不 是 绝对 跳 转 。 

2. 只 有 被 测试 的 条 件 码 求 值 为 真 时 才 进 行 转移 操作 。 





0 1 1 0 条 件 位 移 


DB15 DB12 DB11 DB8 DB7 DBO 





位 移 域 是 8 位 的 值 ， 这 意味 着 转移 可 以 移动 到 一 个 离 目前 位 置 有 +127 字 节 或 -128 字 节 远 
的 另 一 个 位 置 。 如 果 想 得 到 更 远 的 转移 ， 那 么 可 以 将 位 移 域 全 部 置 零 且 将 下 一 个 存储 器 字 用 
作 位 移 的 立即 数值 ， 就 可 达到 从 +16 383 字 节 到 一 16 384 字 节 的 范围 。 

这 样 ， 如 果 计 算 机 正在 执行 一 个 短 循环 ， 则 用 8 位 的 位 移 操 作 起 来 效率 会 更 高 。16 位 的 位 
移 可 以 使 指令 转移 到 更 远 的 地 方 ， 但 其 代价 是 需要 额外 的 存储 器 取 数 操作 。 

早 些 时 候 我 曾 说 过 如 果 条 件 码 求 值 为 真 则 执行 转移 ， 这 意味 着 与 仅 能 测试 CCR 中 一 个 标 
记 的 状态 相 比 ， 我 们 还 可 测试 更 多 的 条 件 。 下 面 的 表 为 我 们 列 出 了 转移 条 件 求 值 的 可 能 方式 。 


CC 进位 清 零 ”0100 C 低 或 相等 0011 C+Z 

CS 进位 置 位 0101 C 小 于 1101 Nx*V+tN*V 
EQ 相等 0111 Zz 负 1011 N 

GE 大 于 或 等 于 1100 Nx*V+N*V 不 相等 0110 Z 

GT 大 于 1110 N*V*Z+N*V*Z 正 1010 N 

HI 高 0010 C*Z 溢出 清 零 1000 Vv 

LE 小 于 或 等 于 1111 Z+N*V+iN*V 溢出 置 位 1001 V 





有 如 此 多 转移 测试 条 件 的 原因 是 ， 转 移 指令 BGT、BGE、BLT 以 及 BLE 是 与 有 符号 
算术 操作 一 起 使 用 的 ， 而 转移 指令 BHI、BCC、BLS 和 BCS 则 是 与 无 符号 算术 操作 一 起 使 
用 的 。 

有 些 指 令 ， 如 NOP 和 RTS (从 子 程序 中 返回 ) 不 需要 操作 数 ， 完 全 由 其 操作 代码 字 规 定 。 

早 些 时 候 我 们 讨论 了 操作 模式 域 在 如 何 对 一 般 指令 操作 做 进一步 限制 方面 所 扮演 的 角色 。 
为 示意 操作 模式 域 如 何 工作 ， 一 个 好 的 途径 是 更 详细 地 考察 ADD 指 令 及 其 所 有 变形 ， 见 图 9-3。 
注意 包含 在 第 $6、7、8 位 的 操作 模式 域 是 如 何 定义 指令 格式 的 。ADD 指 令 是 大 多 数 “ 常 规 ” 指 
令 的 代表 ， 而 其 他 类 的 指令 则 需要 特殊 考虑 。 例 如 ，MOVBE 指 令 包含 两 个 有 效 地 址 。 此 外 ， 所 
有 立即 寻 址 模式 指令 的 源 操作 数 寻 址 模式 都 是 硬 编码 到 指令 中 的 ， 所 以 它 不 是 一 个 真正 的 有 
效 地 址 ， 这 包括 诸如 加 立即 数 (ADDI) 和 减 立即 数 (SUBI) 等 指令 。 
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15 14131211109 8.7 654 3 2 1 0 


[TiToTiTnTnTnJopToploplEA[EA[EA[EA[EA|EA 
ADDB pn<ea> [rT1TolT" Tn Tn TTolo leAleAleAleAleAleA 


ADDAL <ea>An [1[1[oTi[nTn[TnTiT1TiTEA[EAEA[EAEA[EA 


D 0..7 0..7 


图 9-3 ADD 指 令 的 操作 模式 分 解 


一 个 真实 机 器 的 例子 


在 我 们 继续 考虑 其 他 体系 结构 之 前 ， 让 我 们 做 一 些 略 有 不 同 的 ， 但 仍 与 我 们 对 汇编 代码 
和 计算 机 体系 结构 的 讨论 有 关 的 事情 。 记 今 为 止 ， 我 们 实在 是 忽视 了 我 们 编写 的 代码 最 终 要 
运行 于 一 台 真 实 机 器 的 事实 。 存 储 器 测试 程序 确实 不 那么 令 人 兴奋 ， 但 至 少 我 们 可 以 想像 它 
们 是 如 何 与 实际 硬件 一 起 使 用 的 。 为 了 对 我 们 关于 汇编 语言 编码 的 讨论 做 出 结论 ， 让 我 们 来 
看 一 个 实际 的 基于 68000 系 统 的 设计 。 

图 9-4 和 图 9-5 是 一 个 68K 计 算 机 系统 的 处 理 器 和 存储 器 部 分 的 简化 示意 图 。 并 没 显示 出 所 
有 的 信号 ， 但 这 不 会 影响 讨论 。 而 且 ， 我 们 不 想 让 细节 来 烦 我 们 。 






注意 : 并 没有 显示 
出 68000 的 所 有 信号 


时 钟 
复位 生成 器 





图 9-4 基于 68000 计 算 机 系统 的 简化 示意 图 。 此 图 中 只 显示 了 68000 的 CPU 
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图 9-5 图 9-4 的 68K 计 算 机 系统 的 存储 器 系统 的 简化 示意 图 


参见 地 址 总 线 ， 如 图 9-4 和 图 9-5 所 示 ， 我 们 看 到 有 没有 标记 为 A0 的 地 址 位 。 正 如 我 们 在 


图 7-6 中 所 见 到 的 ，A0 是 由 状态 机 通过 UD5 或 LDS 合成 出 来 的 。 由 于 所 有 相关 的 控制 信号 都 
是 低 有 效 的 ， 所 以 图 右 侧 的 或 门 实际 上 是 被 用 作 反 相 的 逻辑 与 门 。 

68K 环 境 中 的 有 效 地 址 (valid address) 信号 称 为 地 址 选 通 (address strobe) ， 在 图 中 
用 45 标记 。 这 个 信号 被 传送 到 两 个 地 方 。 它 被 用 于 读 操作 和 写 操 作 的 准许 信号 ， 在 图 中 通过 
下 面 的 两 个 或 门 触发 (要 一 直 想 着 是 “ 反 相 的 逻辑 与 门 ”)， 并 到 达 地 址 译 码 模 块 。 辨 别 出 这 
个 功能 模块 并 和 弄 明白 它 是 如 何 工作 的 ， 对 你 来 说 应 该 没有 困难 。 紧 要 时 你 可 能 要 自己 设计 ! 
因此 ， 在 45 信号 变 低 保 证 地 址 有 效 之 前 ， 我 们 将 不 对 地 址 进行 译 码 。I/O 译 码 器 还 可 以 对 1/O 
设备 进行 译 码 ， 虽 然 在 这 个 图 中 没有 显示 。 

由 于 68K 的 读 信 号 和 写 信 和 号 不 是 独立 的 ， 所 以 我 们 用 非 门 和 或 门 来 合成 READ 信和 号。 我 们 
还 可 以 用 或 门 和 45 信和 号 来 限制 READ 信 号 和 WRITE 信和 号， 或 门 起 到 了 一 个 反 相 逻辑 与 门 的 作 
用 。 严 格 地 说 这 是 不 必要 的 ， 因 为 我 们 已 经 在 用 同样 的 方式 限制 地 址 译 码 信号 了 。 

最 后 一 个 要 注意 的 模块 是 位 于 图 中 下 面 左 侧 的 中 断 控 制 器 模块 。68K 采 用 了 低 有 效 的 中 断 
输入 ， 标 记 为 7z0、 古 和 殉 2。 所 有 三 条 线 都 变 低 将 产生 一 个 第 7 级 中 断 。 我 们 将 在 第 12 章 中 
研究 中 断 。 中 断 控 制 器 的 输入 是 7 个 标记 为 INT1-INT7 的 低 有 效 输入 。 如 果 INT7 变 低 ， 则 所 有 的 
输出 线 也 将 变 低 ， 指 出 INT7 是 一 个 第 7 级 中 断 。 现 在 ， 如 果 INT6 为 低 ( JP0 =1、x7Pl =0、 
1P2 =0)，INT5 也 变 低 ， 则 输出 将 不 改变 ， 因 为 中 断 控 制 器 不 但 要 对 中 断 输 入 译 码 ， 而 且 还 要 
对 它们 进行 优先 级 排队 。 

图 9-5 显 示 的 是 计算 机 的 存储 器 一 侧 。 它 由 两 个 128K x 8 的 RAM 芯 片 和 两 个 128K x 8 的 
ROM 芯 片 组 成 。 注 意 成 对 的 器 件 和 来 自 处 理 器 的 两 个 片 选 信号 是 怎样 一 起 得 出 字 节 写 控制 的 。 
电路 的 其 余部 分 对 于 你 应 该 是 非常 熟悉 了 。 
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各 9 章 


这 个 计算 机 设计 的 存储 系统 是 由 256KB 的 ROM 组 成 ， 处 于 从 $000000 到 $3FFFF 的 地 
址 位 置 。RAM 处 于 从 $100000 到 $13FFFF 的 地 址 位 置 。 从 这 个 简化 的 示意 图 来 看 ， 这 个 
地 址 映射 并 不 是 显而易见 的 ， 因 为 你 不 知道 图 9-4 中 标记 为 “地 址 译 码 器 ”的 电路 模块 的 


细节 0° 
总 结 


本 章 涵盖 的 内 容 如 下 : 


。68K 体 系 结构 的 高 级 寻 址 模式 及 其 与 高 级 语言 的 关系 。 


。68K 体 系 结构 的 各 类 指令 的 概述 。 
。 采 用 TRAP #15 指 令 来 模拟 1/O。 
。 用 C 编 写 的 程序 在 汇编 语言 中 如 何 运行 ，C 编 译 器 如 何 利用 68K 体 系 结构 的 高 级 寻 址 


模式 。 


。 如 何 实现 程序 反 汇 编 及 其 与 体系 结构 的 关系 。 


。 基 于 68K 计 算 机 系统 的 功能 模块 。 


参考 文献 
p: 704 


习题 


1. 考察 下 面 显示 的 汇编 语言 代码 块 。 


a. 在 指示 出 的 指令 中 ， 存 储 字 节 FF 的 存储 器 地 址 是 什么 ? 
b. 该 代码 段 是 可 重 定位 的 吗 ? 为 什么 ? 


org $400 
start movea.w #$2000,A0 
move.w #$0400,D0 
move.b 
ED jmp start 
end $400 


#$f£f£, ($84,A0, DO) * ff 去 哪 了 ? 


提示 : 记 住 位 移 涉及 补 码 数 。 另 外 ， 该 指令 也 可 写成 ， 

move.b #$FF,$84(A0,DO) 

2. 考察 下 面 的 代码 段 ， 然 后 回答 关于 该 代码 段 所 执行 的 操作 的 问题 。 你 可 以 假设 堆栈 已 适当 
地 初始 化 了 。 简 要 描述 那 条 突出 显示 的 指令 的 结果 。 什 么 值 被 移动 到 目的 地 址 ? 


00001000 
00001006 
00001008 
0000100E 
00001010 
00001014 
00001016 
$00AA0040, 


41F9 00001018 10 
2c50 
203C 00001B00 52 
2Cc00 13 
2D8016846. 4 
60FE 15 
O00AA0040 C8300000 16 


$Cc8300000 


re 


START: 


SEOR TITEY 


LEA 


! Alan Clements, 68000 Family Assembly Language; ISBN 0-534-93275-4, PWS Publishing Company, Boston, 1994, 


DATA+2,A0 


MOVEA.L (A0),A6 


MOVE.L 


#$00001B00, D0 
D0 ,D6 


:bE D0. YD, A6,D6.L). 


STOP_IT 
DC . 工 


3. 考察 下 面 的 代码 段 ， 然 后 回答 关于 该 代码 段 所 执行 的 操作 的 问题 。 你 可 以 假设 堆栈 已 适当 
地 初始 化 了 。 简 要 描述 那 条 突出 显示 的 指令 的 结果 。 突 出 显示 的 指令 完成 后 ， 寄 存 器 D0 的 


值 是 什么 ? 


高 级 汇编 语言 编程 


00000400 4FF84000 STRART : 
00000404 3F3C1CRAA 

00000408 3F3C8000 

0000040C 223C00000010 

00000412 203C216E0000 

00000418 BE2RA0 

0000041A 383C1000 

0000041E 2C1F 

00000420 C086 

00000422 60FE STOP_HERE: 


4. 用 一 、 两 句 话 回 答 下 述 问 题 : 
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LEA $4000, SP 
MOVE.W #$1CAA, - (SP) 
MOVE.W #$8000,- (SP) 
MOVE.L #16,D1 

MOVE.L #$216E0000,D0O 


ASR.L D1,D0 

MOVE.W #$1000,D4 

MOVE.L (SP)+,D6 

MD 奖 
BRA STOP_HERE 


a. 当 C++ 函 数 退 出 时 ， 为 什么 局 部 变量 就 不 起 作用 了 ? 
b. 给 出 两 个 理由 ， 说 明 为 什么 高 级 语言 (如 C) 中 的 变量 在 使 用 前 必须 先 声明 ? 
c. 68000 汇 编 语言 指令 LINK 和 ULINK 是 这 样 一 些 指令 的 代表 ， 它 们 被 创造 的 目的 是 为 了 支 


持 一 种 高 级 语言 。 为 什么 ? 


5. 下 面 是 32 字 节 存 储 器 内 容 的 显示 ， 你 可 以 在 调试 器 中 用 “显示 存储 器 ”看 到 这 些 内 容 。 这 


个 内 容 所 显示 的 3 条 指令 是 什么 ? 


00000400 06 79 55 55 00 00 AA AA 06 B9 AA AA 55 55 00 00 
00000410 FF FE 06 40 AA AA 00 00 FF 00 00 00 00 00 00 00 


6. 假设 你 正在 试图 为 存储 器 中 的 68K 指 令 写 一 个 反 汇编 程序 。 寄 存 器 A6 指 向 你 正 要 反 汇 编 的 
下 一 条 指令 的 操作 代码 字 。 考 察 下 面 的 算法 ， 用 语言 描述 它 是 如 何 工 作 的 。 对 于 这 个 例子 ， 
你 可 假设 <A6> = $00001A00 且 <$00001A00> = %1101111001100001。 


shift EQU 12 
start LEA jmp_table,AO0 
CLR.L DO 


JSR 00(A0,DO) 
{ 其 他 指令 } 


code0000 
code0001 
code0010 
code0011 
code0100 
code0101 
code0110 
code0111 
code1000 
code1001 
code1010 
code1011 
code1100 
code1101 
code1110 
code1111 


jmp_table 


和 和 


* 移 12 位 


* 变 址 进入 表 中 

* 对 其 清 零 

* 在 这 里 处 理 

* 右 移 12 位 

* 移 动 这 些 位 

* 形 成 偏 移 

* 带 变 址 的 间接 跳 转 


7. 将 第 8 章 习 题 10 的 存储 器 测试 程序 转换 成 可 重 定 位 的 。 为 了 看 看 你 是 否 已 经 成 功 了 ， 请 按 如 


下 要 求 写 程序 : 
a. 程序 起 始 (ORG) 于 $400。 


b. 在 起 始 处 加 一 些 代码 ， 使 得 当 它 开始 运行 时 ， 重 定位 到 存储 器 中 $000A0000 的 位 置 。 





Oo 


Cy 
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c. 测试 从 $00000400 到 $0009FFF0 的 存储 器 区 域 。 
d. 确保 对 堆栈 的 定位 使 之 不 被 写 覆 盖 。 


. 这 个 习题 将 通过 对 第 8 章 的 存储 器 测试 习题 引入 几 个 新 的 概念 来 拓展 你 对 68K 的 掌握， 它 也 


是 一 个 用 适当 的 子 程序 构建 汇编 代码 的 好 例子 。 这 个 习题 通过 TRAP 共 15 指 令 的 运用 来 引 
入 用 户 WO 的 概念 ,你 应 该 通过 研究 与 E68K 程 序 一 起 提供 的 帮助 软件 来 熟知 TRAP #15 指 令 。 
另外 ， 你 也 可 以 熟 读 Clements' 教 材 的 704 页 中 关于 TRAP #15 指 令 的 细节 。 

TRAP ##15 指 令 是 模拟 器 的 产物 ， 设 计 它 的 目的 是 允许 模拟 器 和 用 户 之 间 发 生 IO 操 作 。 
如 果 你 真 的 在 写 VO 程 序 ， 那 么 你 可 能 会 做 一 些 不 同 的 事情 ， 但 很 多 事情 是 相同 的 。 

与 TRAP #15 指 令 相 关联 的 是 各 种 任务 ， 每 个 任务 都 有 编号 ， 与 每 个 任务 相关 联 的 是 
一 个 API， 用 来 解释 它 如 何 工 作 。 例 如 ， 任 务 夫 0 要 将 一 串 字 符 打 印 在 显示 器 上 上， 并 加 入 一 
个 换行 符 使 得 光标 前 进 到 下 一 行 的 开始 处 。 为 了 使 用 任务 #0， 你 必须 建立 下 面 的 寄存 器 
(这 就 是 API) : 

。 DO 以 字 节 装载 任务 编号 
。 AI 装载 字符 串 开 始 处 的 地 址 
。D1 以 字 存 储 着 要 打印 字符 串 的 长 度 

一 旦 建立 了 这 三 个 寄存 器 ， 你 就 能 将 TRAP #15 作 为 一 条 指令 调用 ， 你 的 消息 就 能 打印 
在 显示 器 上 了 。 这 里 是 一 个 示意 其 如 何 工 作 的 样 例 程序 。 为 了 输出 字符 串 “Hello world!”， 
你 可 以 采用 如 下 的 代码 片段 : 

* 将 一 个 字符 串 打印 到 显示 器 的 测试 程序 


实 突 安安 二 内 突 帘 商 认 妆 突 究 宙 妆容 帘 安 帘 灾 安 认 家 空 业 病 安 妆 次 突 窑 六 业 安 妆 突 究 宙 安安 安 寅 六 次 六 


OPT CRE 
taskO0 EQU 00 
ORG $400 
start MOVE.B #task0, DO * 将 任务 编号 装 入 D0 
LEA string,Al * 获 得 字符 串 的 地 址 
MOVE .WwW str_len,D1 * 获 得 字符 串 的 长 度 
TRAP #15 * 开 始 打印 
.STOP #$2700 * 回 到 模拟 器 
* 数据 区 域 
string DC.B ‘Hello world’ * 这 里 存储 消息 
str_len DC.W str_len-string * 获得 字符 串 的 长 度 
END $400 


除了 不 打印 换行 符 ， 任 务 #1 与 任务 并 0 几乎 相同 。 当 你 想 提 示 用 户 输入 信息 时 ， 这 就 
很 便利 。 你 就 应 该 采用 任务 夫 1 而 不 是 任务 2 来 发 出 提示 符 。 
此 外 ， 你 可 能 想 从 用 户 那 里 获得 信息 。 比 如 ,“ 他 们 想 从 哪里 运行 存储 器 测试 以 及 他 们 
想 用 什么 测试 码 ? ”还 有 ， 你 可 能 会 问 他 们 是 否 想 用 一 个 不 同 的 测试 码 再 运行 一 次 测试 。 
问题 陈述 


:拓展 存储 器 测试 程序 (第 8 章 ， 习 题 10) ， 使 用 户 能 够 输入 存储 器 测试 的 起 始 地 址 、 存 储 器 


测试 的 结束 地 址 以 及 测试 所 采用 的 字 测 试 码 。 只 使 用 输入 测试 码 ， 不 需要 对 位 取 反 或 做 任 
何其 他 测试 。 


2. 要 测试 的 存储 区 域 在 $00001000 和 $000A0000 之 间 。 
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.程序 首先 打印 出 一 个 测试 概要 标题 ， 包 含 如 下 信息 : 


地 址 (ADDRESS) 写 数 据 (DATA WRITTEN) 读数 据 (DATA READ) 


.每 次 发 生 错误 ， 你 要 打印 错误 地 址 、 你 写 的 数据 码 以 及 你 读 回 的 数据 码 。 
. 将 堆栈 定位 在 $A0000 以 上 。 
. 当 程 序 开始 运行 时 ， 它 提示 用 户 输入 测试 的 起 始 地 址 (在 $00001000 之 上 )， 用 户 就 输入 测 


试 的 起 始 地 址 。 然 后 ， 程 序 就 提示 用 户 输入 测试 的 结束 地 址 (在 SFFFF 以 下 )， 用 户 就 输入 
这 个 地 址 。 最 后 ， 程 序 提 示 用 户 输入 测试 所 采用 的 字 出 试 码 。 

你 必须 检查 一 下 ， 看 看 结束 地 址 是 否 比 起 始 地 址 至 少 大 一 个 字 的 长 度 。 你 不 必 为 数字 
输入 的 正确 性 进行 测试 ， 在 这 个 问题 中 你 可 以 假设 只 输入 了 正确 的 地 址 和 数据 值 。 正 确 的 
输入 是 : 数字 0 到 9、 小 写字 母 a 到 f、 大 号 字母 A 到 F。 

一 旦 这 些 信息 被 输入 ， 测 试 概要 标题 行 就 打印 到 显示 器 ， 测 试 开始 。 遇 到 的 任何 错误 
也 如 上 所 述 打印 到 显示 器 上 。 

讨论 

一 旦 你 从 用 户 那 里 获得 字符 串 ， 你 就 必须 认识 到 它 是 ASCII 格 式 的 。ASCII 是 用 于 打印 
字符 和 读 取 字 符 的 代码 。 数 字 0 到 9 的 ASCII 代 码 是 $30...$39， 字 母 a 到 f 的 ASCII 代 码 是 
$61...$66， 字 母 A 到 F 的 ASCII 代 码 是 $41...$46。 

因此 ， 如 果 提 示 用 户 输 入 地 址 ， 而 用 户 输入 了 9B56， 则 当 TRAP #15 指 令 结束 时 ， 存 储 
器 中 将 有 这 样 4 个 字 节 ; $39、$42、$35、$36。 那 么 ， 你 如 何 从 这 些 字 节 得 到 地 址 $9B56 
呢 ? 我 们 必须 写 一 个 算法 。 换 名 话说， 你 必须 将 ASCII 值 转换 成 等 价 的 16 位 字 ， 这 是 练习 
移 位 和 屏蔽 技术 的 好 机 会 。 为 了 得 到 一 个 表示 成 ASCII 0-9 的 数字 ， 你 必须 从 这 个 ASCII 值 
中 减 去 $30， 剩 下 的 就 是 这 个 数字 值 。 如 果 数 字 是 “B”， 则 你 也 要 减 去 一 个 不 同 的 数字 来 
得 到 十 六 进 制 值 $B 。 类 似 地 ， 如 果 数 字 是 “b”， 则 你 也 必须 减 去 另 一 个 不 同 的 值 。 

下 面 就 是 地 址 $9B56 的 二 进 制 形式 ， 

DB15 DB12 DB7 DB3 DB0 

1001 1011 0101 0110 


现在 ， 我 有 从 ASCII $39 译 码 得 到 的 值 9， 且 它 处 于 位 置 0 到 3 ， 我 们 如 何 使 它 处 于 位 置 


13 到 15 呢 ? 用 一 个 流程 图 设计 出 这 个 算法 是 很 有 意义 的 。 





第 10 章 Intel x86 体 系 结构 


学 习 目 标 

。 描 述 8086 和 8088 微 处 理 器 的 处 理 器 体系 结构 ， 

。 描 述 8086 和 8088 处 理 器 的 基本 指令 集体 系 结构 ， 

。 使 用 段 的 地 址 存储 器 : 偏 移 的 寻 址 技术 ， 

。 描 述 8086 体 系 结 构 和 68000 体 系 结构 之 间 的 异同 ; 

。 结 合 8086 体 系 结构 的 所 有 寻 址 模式 和 指令 ， 编 写 8086 汇 编 语言 的 简单 程序 。 


10.1 引言 


Intel 是 当今 世界 上 最 大 的 半导体 生产 厂商 。 它 上 升 到 目前 的 地 位 是 由 于 与 BM 的 供应 伙 
伴 关 系 。 当 时 ，IBM 需 要 为 它 正在 佛罗里达 州 波 卡 瑞 顿 开发 的 新 型 PC-XT 个 人 计算 机 配置 一 
种 处 理 器 。IBM 的 最 佳 选择 是 Zilog 公 司 的 Z-800， 而 Zilog 公 司 是 Intel 的 竞争 对 手 之 一 ， 访 公 
司 由 那些 研究 最 初 的 Intel 8080 处 理 器 的 Intel 员 工 组 成 。Zilog 公 司 生产 了 一 种 与 8080 编 码 兼 容 
的 增强 型 处 理 器 一 一 Z80, Z80 能 够 执行 所 有 的 8080 指 令 和 一 些 其 他 指令 ， 而 且 也 比 8080 似 乎 更 
易于 进行 接口 。 

电脑 爱好 者 们 乐于 使 用 Z80, Z80 成 了 几乎 所 有 早期 基于 CP/M 操 作 系 统 (由 Digital 
Research 公 司 的 Gray Kidall 开 发 ) 的 PC 的 首选 处 理 器 。 当 时 传说 Zilog 公 司 正 在 研究 Z80 的 16 
位 版 本 一 一 Z800， 这 种 处 理 器 将 比 8 位 Z80 有 很 大 的 性 能 提高 。IBM 最 初 提议 Zilog 作 为 PC-XT 
的 可 能 的 CPU 供应 商 。 今 天 ， 应 该 承认 的 是 : Intel 发 展 到 目前 这 种 辉煌 的 地 步 是 因为 Zilog 当 
时 没 能 按期 交 货 给 IBM 。 

1978 年 ，Intel/ 有 了 8080 的 16 位 继承 者 一 一 8086/8088。8088 在 内 部 与 8086 相 同 ， 只 不 过 8088 
是 8 位 外 部 数据 总 线 ， 而 8086 是 16 位 。 这 当然 会 限制 设备 的 性 能 ， 但 是 对 于 IBM 来 说 ， 它 吸引 
人 的 特性 是 能 够 大 幅度 降低 系统 成 本 。Intel 能 够 满足 [BM 的 订货 时 间 要 求 ， 一 个 频率 为 
4.077MHz 的 8088 CPU 被 配置 到 最 初 的 IBM PC-XT 个 人 计算 机 上 。 对 于 操作 系统 ，IBM 选 择 了 
西雅图 一 个 小 软件 公司 的 类 似 CP/M 的 16 位 操作 系统 ， 该 公司 名 叫 微软 。 尽 管 Zilog 还 是 发 展 到 
了 今天 ， 但 他 们 仍然 没有 从 未 能 发 行 Z800 的 失败 中 恢复 过 来 。 这 是 一 个 错过 交付 日 期 的 经 典 例 
子 ， 所 有 软件 开发 商 们 都 应 该 牢记 其 教训 。 顺 便 提 一 下 ， 最 初 的 Z80 也 沿用 到 了 今天 并 将 继续 
作为 借入 式 控 制 器 使 用 。 很 难 估计 它 的 影响 到 底 有 多 大 ， 但 是 必定 还 有 数 十 亿 行 Z80 代 码 仍然 
在 使 用 。 

PC 产业 的 发 展 基本 上 是 沿 着 Intel x86 体 系 结构 的 不 断 发 展 和 改进 的 方向 前 进 的 。Intel 开 
发 出 80286 作 为 后 继 的 CPU ，IBM 则 制造 出 使 用 这 种 CPU 的 PC-AT 计 算 机 。80286 引 入 了 保护 
模式 (protected mode) 的 概念 ， 这 使 得 操作 系统 能 够 实现 任务 管理 ， 以 至 于 单 任务 操作 系统 
MS-DOS 都 被 扩展 到 能 够 允许 简单 形式 的 多 任务 并 发 。80286 仍 然 是 16 位 机 器 。 在 这 个 时 期 ， 
Intel 还 开发 了 80186/80188 集 成 微 控制 器 系列 ， 它 们 是 使 用 8086/8088 核 和 额外 的 片上 外 围 设备 
的 CPU， 这 使 得 它们 对 于 很 多 嵌入 式 计算 机 产品 来 说 具有 作为 片上 解决 方案 的 巨大 魅力 。 这 
些 片 上 外 围 设备 包括 : 
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。2 个 直接 存储 器 访问 控制 器 (DMA) 

。3 个 16 位 可 编程 定时 器 

。 时 钟 发 生 器 

。 片 选单 元 

。 可 编程 控制 寄存 器 

随 着 其 他 半导体 厂商 生产 出 更 高 集成 度 的 变种 ， 例 如 AMD 公 司 的 EB86 习 系列 和 NEC 的 V- 
系列 ，80186/188 系 列 在 今天 仍然 很 受 欢迎 。 特 别 是 外 围 设备 的 组 合 使 得 186 系 列 对 控制 器 的 
磁盘 驱动 器 制造 商 具 有 很 大 的 吸引 力 。 

伴随 着 80386 的 引入 ，x86 体 系 结构 最 终 被 扩充 到 了 32 位 。PC 界 对 硬件 和 软件 (Windows 
3.0) 的 反应 主要 集中 在 这 种 体系 结构 。80386 的 后 继 产 品 80486 和 奔腾 (Pentium) 系列 继续 
改进 了 这 种 在 i386 中 定义 的 基本 体系 结构 。 

对 这 个 系列 的 兴趣 使 得 我 们 从 i386 体 系 结构 开始 回溯 并 关注 于 最 初 的 8086 系 列 体系 结构 。 
这 种 体系 结构 将 给 我 们 提供 一 个 很 好 的 参考 点 ， 使 我 们 能 获得 68000 和 8086 的 对 比 性 了 解 。 
68000 通 常 被 规定 为 16/32 位 的 体系 结构 ， 而 8086 也 能 够 做 很 多 32 位 的 操作 。 而 且 ，68K 的 默认 
操作 数 大 小 是 16 位 ， 所 以 这 两 种 体系 结构 之 间 的 相关 对 比 是 相当 有 效 的 。 

因此 ， 我 们 将 从 8086 的 视角 来 看 待 x86 系 列 。 还 有 很 多 关于 8086 后 继 体系 结构 的 文献 可 供 
参考 ， 感 兴趣 的 读者 可 以 找 找 。 

当 开 始 学 习 8086 体 系 结构 和 指令 集体 系 结构 时 ， 显 然 我 们 很 多 的 注意 力 是 集中 在 DOS 
操作 系统 和 PC 运行 时 环境 上 的 。 对 于 这 一 观点 ， 我 们 有 个 关于 68K 体 系 结构 的 有 趣 的 反例 。 
当 研 究 68K 时 ， 我 们 是 在 一 个 “仿真 ”环境 中 运行 ， 因 为 PC 机 和 68K 的 指令 集 是 不 兼容 的 。 
所 以 ， 应 该 能 够 由 程序 产生 虚拟 的 68K ， 而 且 该 程序 创建 的 68K 虚 拟 机 可 供 你 的 代码 在 上 面 
运行 。 

对 于 8086 ISA 来 说 ， 则 执行 在 “本 地 ”环境 下 ， 因 为 汇编 程序 的 指令 集 与 机 器 是 兼容 的 。 

因此 ， 你 可 以 很 轻松 地 执行 (运行 良好 的 ) 在 PC 机 DOS 窗 口内 编写 的 8086 程 序 。 事 实 上 ， 
通过 PC 机 的 基本 输入 输出 系统 (BIOS) 调用 DOS 操 作 ， 就 能 很 容易 地 实现 来 自 键盘 的 VO 和 
到 显示 器 的 WO。 这 是 有 利 有 灿 的 ， 因 为 当 编 写 和 执行 8086 程 序 时 我 们 不 得 不 处 理 DOS 环 境 本 
身 的 接口 问题 ， 这 意味 着 需要 学 习 一 些 新 的 只 适用 于 DOS 环 境 的 汇编 指令 。 

最 后 ， 与 我 们 开始 学 习 的 68K 体 系 结构 相 比 ， 掌 所 i186 的 基本 指令 集体 系 结构 需要 一 个 更 
加 努力 的 学 习 过 程 。 我 肯定 这 其 中 会 有 几 个 比较 艰难 的 时 期 ， 但 请 允许 我 对 揭露 这 个 过 程 本 
身 有 个 人 偏见 。 

为 了 处 理 这 些 问 题 ， 我 们 选择 了 “KISS” 方 法 (Keep It Simple, Stupid) ， 并 将 我 们 的 目 
光 集 中 在 最 终 目标 上 。 由 于 我 们 想 要 完成 任务 的 是 对 现代 计算 机 体系 结构 有 一 个 相当 程度 的 
了 解 ， 所 以 我 们 将 把 掌握 i186 体系 结构 的 汇编 程序 设计 技巧 的 问题 留 到 其 他 时 间 考 虚 。 因 而 ， 
我 们 将 有 区 别 地 把 重点 放 在 以 下 几 方面 : 把 学 习 8086 寻 址 模式 和 指令 作为 我 们 的 主要 目标 ， 
而 掌握 DOS 汇 编 语言 程序 设计 的 基本 规则 作为 第 二 目标 (需要 时 才学 习 )。 然 而 ， 你 应 该 能 
从 186 和 DOS 汇 编 语言 程序 设计 的 大 量 资源 中 获得 我 为 了 清楚 起 见 所 省 略 的 任何 信息 。 请 继续 
往 下 学 习 ! 


10.2 8086 CPU 的 体系 结构 


图 10-1 是 8086 CPU 的 一 个 简化 框图 。 你 可 能 会 认为 这 个 图 看 起 来 比 图 7-11 所 示 的 68000 处 
理 器 的 框图 要 复杂 得 多 。 尽 管 这 两 个 图 看 起 来 很 不 相间 ， 但 是 它们 之 间 有 一 些 相 似 点 。 在 功 
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能 上 ， 通 用 寄存 器 基本 对 应 于 68K 的 数据 寄存 器 。 图 中 右 侧 标记 为 总 线 接 口 单 元 (bus 
interface unit, BIU) 的 寄存 器 叫做 段 寄 存 器 (segment register) ， 大 体 上 对 应 于 68K 的 地 址 寄 
存 器 。 


地 址 总 线 20 位 


/A 























| Ds | 
16 位 ALU 数 据 总 线 | ss | 
| ip | 
| ee 
临时 寄存 器 通信 寄存 器 
NA 
| 总 线 接 
A : EE 口 单元 


执行 单元 (EU) 


图 10-1 Intel 8086 CPU 的 简化 框图 。 由 Tabak' 提 供 


8086 严 格 地 由 两 个 独立 自治 的 功能 模块 组 成 。 执 行 单元 (execution unit, EU) 处 理 数据 
的 算术 和 有 还 辑 操作 ， 它 拥有 一 个 6 字 节 的 先进 先 出 (FIFO) 指令 队列 (8088 是 4 字 节 )。BIU 的 
段 寄 存 器 负责 访问 从 存储 器 中 来 的 指令 和 操作 数 。 两 个 功能 模块 之 间 的 主要 连接 就 是 这 个 指 
令 队 列 ，BIU 预 先 从 当前 执行 指令 向 前 看 以 保证 队列 不 空 ， 从 而 让 EU 对 队列 中 的 指令 进行 译 
码 和 操作 。 

在 BIU 一 侧 看 起 来 像 木工 锯 脚 架 的 符号 叫做 多 路 选择 器 (multiplexer MUX) ， 它 的 功能 是 
将 地 址 和 数据 信息 组 合成 单一 的 20 位 外 部 总 线 。 多 路 选择 (共享 ) 总 线 使 得 8086 CPU 封装 后 
只 有 40 个 引 脚 , 而 68000 则 有 64 个 引 脚 , 这 主要 是 由 于 23 位 地 址 和 16 位 数据 带 来 了 额外 的 引 脚 。 
然而 ， 没 有 免费 的 午餐 。 这 种 多 路 总 线 要 求 使 用 8086 的 系统 必须 在 板 上 有 外 部 逻辑， 该 外 部 
逻辑 在 总 线 周 期 的 前 半 部 分 将 地 址 锁 存 在 保持 寄存 器 中 ， 这 样 做 是 为 了 在 总 线 周期 的 后 半 部 
分 有 一 个 稳定 的 地 址 送 给 存储 器 。 如 果 你 回忆 一 下 图 6-23 (一 个 通用 微 处 理 器 的 时 序 图 )， 那 
么 我 们 就 可 以 将 8086 的 总 线 周期 描述 为 4 个 “T” 状 态 ， 标 记 为 T1 到 T4。 如 果 要 在 总 线 周 期 中 
包含 等 待 状态 ， 那 么 可 以 把 它 看 成 是 T3 状 态 的 延伸 。 

处 理 器 在 T1 的 下 降 治 将 20 位 地 址 送 给 外 部 逻辑 电路 并 发 出 锁 存 信号 ， 即 地 址 锁 存 使 能 
(address latch enable，ALE)。 ALE 用 来 锁 存 总 线 周 期 的 地 址 部 分 。 数 据 在 T3 上 升 沿 时 输出 
并 在 T3 下 降 沿 时 读 入 。20 位 宽 的 地 址 总 线 使 得 8086 拥 有 1MB 的 地 址 范围 。 最 后 ，8086 对 地 
址 字 的 对 齐 方式 没有 任何 限制 ， 一 个 字 可 以 存在 于 奇数 边界 也 可 以 存在 于 偶数 边界 。BIU 管 
理 用 于 提取 字 中 两 个 字 节 和 除了 性 能 惩罚 之 外 的 额外 总 线 周 期 ， 这 种 行为 对 软件 开发 者 是 透 
明 的 。 

图 10-2 显 示 的 是 8086 的 程序 员 模型 。 
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段 寄存 器 
D15 DO 
CS 代码 段 
DS 数据 段 
ES 附加 段 
SS 堆栈 段 
指针 和 变 址 寄存 器 
D1 DO 
BP 指令 指针 和 标志 
sl D15 






DI 目的 变 址 
SP | 堆栈 指针 











x| x |x |x|or[or| re |re|sr [ze | x Iar [x [pe[ x [ce 
X= 保留 位 
图 10-2 8086 寄 存 器 组 的 程序 员 模型 


10.3 数据 寄存 器 、 变 址 寄存 器 和 指针 寄存 器 


在 8086 中 ， 有 8 个 16 位 的 通用 寄存 器 用 来 进行 算术 操作 和 逻辑 操作 。 此 外 ， 对 于 8 位 操作 ， 
4 个 数据 寄存 器 AX、BX、CX 和 DX 可 以 进一步 分 成 高 字 节 和 低 字 节 两 个 寄存 器 ， 这 取决 于 字 
节 存 储 在 寄存 器 中 的 什么 位 置 。 因 此 ， 对 于 字 节 操作 ， 寄 存 器 可 单独 进行 寻 址 。 例 如 ，NMOV 
REL， 6D 指 令 将 十 六 进 制 的 立即 数 6D 放 人 寄存 器 AL。 是 的 ， 我 知道 ， 这 是 后 退 。 

而 且 ， 当 存储 在 16 位 寄存 器 中 的 数据 被 转 存 到 存储 器 中 时 ， 它 们 将 按照 与 寄存 器 中 相反 
的 次 序 进行 存储 。 因 此 ， 如 果 <AX> = 109C， 那 么 该 数据 就 会 被 写 到 在 储 器 的 1000 和 1001 的 
地 址 中 ， 存 储 器 中 的 字 节 顺序 将 为 ; 

<1000> = 9C, <1001> = 10 ”{ 低 端 字 节 序 ! 还 记得 吗 ? } 

另外 ， 这 些 数 据 寄 存 器 不 像 68K 中 D0 到 D7 那样 完全 通用 。AX 寄 存 器 及 其 两 个 8 位 寄存 器 
AH 和 AL 都 是 累加 器 (accumulator) 。 累 加 器 是 一 个 用 于 算术 运算 和 还 辑 运 算 的 寄存 器 。 当 你 
使 用 乘法 (MUL) 指令 和 除法 (DIV) 指令 时 ， 必 须 使 用 AX 寄 存 器 。 例 如 ， 下 面 的 代码 片段 : 

MOV AL,10 


NMOV DH,25 
MUL DH 


可 以 将 AL 寄存 器 中 的 内 容 和 DH 寄 存 器 中 的 内 容 做 一 个 8 位 乘 8 位 的 乘法 ， 并 把 16 位 的 结果 值 
存储 在 AX 霖 存 器 中 。 注 意 在 乘法 指令 中 没有 必要 指明 AL 寄存 器 ， 因 为 字 节 乘 法 中 必须 使 用 
它 。 对 于 16 位 的 操作 数 ， 结 果 则 存在 DX:AX 寄 存 器 对 中 ， 其 中 高 位 字 存在 DX 寄 存 器 中 而 低位 
字 存 在 AX 寄 存 器 中 。 例 如 : 


MOV AX,0300 
MOV DX,0400 
NMUL DX 


将 产生 十 进 制 的 结果 : <DX:AX> = 0001:D4C0 = 120 000 
这 里 有 几 个 值得 注意 的 地 方 ;: 
。 被 执行 指令 的 类 型 ( 字 节 或 者 字 ) 由 所 使 用 的 寄存 器 及 操作 数 的 大 小 决定 。 


上 
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。 数 字 被 认为 是 字面 值 ， 不 用 任何 特别 的 符号 ， 比 如 68000 汇 编 器 中 使 用 的 “#” 符 号 。 
。 在 某 些 情况 下 ，16 位 寄存 器 可 以 组 合 在 一 起 形成 32 位 宽 的 寄存 器 。 
。 尽 管 在 这 个 例子 中 没有 显示 ， 但 十 六 进 制 数 是 由 紧 跟 其 后 的 “h” 所 指示 的 。 而 且 ， 以 
A 到 F 开 头 的 十 六 进 制 数 需要 在 前 面 加 一 个 0， 以 免 被 认为 是 标号 。 
一 0AC55h = 十 六 进 制 数 AC55 
一 AC55h = 标号 “AC55h” 
BX 寄存 器 可 以 用 作 16 位 偏 移 地 址 指针 ， 下 面 的 代码 片段 将 值 9OAAh 装 载 到 了 绝对 存储 地 
址 1000Ah 处 。 
MOV AX, 1000h 
MOV DS, AX 
MOV BX, 000Ah 
MOV [BX], OAAh 
从 这 个 例子 我 们 可 以 看 到 : 
。 段 寄存 器 DS 必须 从 一 个 寄存 器 进行 装载 ， 而 不 能 以 一 个 立即 数值 进行 装载 。 
。 将 BX 寄存 器 放 在 括号 中 就 将 有 效 寻 址 模式 改 为 了 寄存 器 间接 寻 址 。 完 全 的 存储 器 装载 
地 址 是 [DS:BX]。 注 意 DS 寄 存 器 没有 指明 ， 是 隐 含 的 。 
。DS 寄 存 器 是 数据 移动 操作 默认 使 用 的 寄存 器 ， 就 像 CS 寄存 器 用 于 引用 指令 一 样 。 但 是 ， 
可 以 通过 明确 指明 使 用 的 段 寄 存 器 来 强行 修正 默认 寄存 器 。 例 如 ， 下 面 的 代码 片段 名 
略 了 DS 段 寄存 器 ， 并 强制 指令 使 用 [ES:BX] 寄 存 器 来 操作 。 
MOV RX，1000h 
MOV CX，2000h 
MOV DS, RX 
MOV ES, CX 
MOV BX, O000Ah 
ES:MOV WwW. [BX], 055h 
这 里 也 要 注意 “w.” 的 用 法 。 这 是 显 式 地 告诉 指令 把 文字 解释 为 一 个 字 值 一 -0055h。 否 
则 ， 汇 编 器 可 能 会 把 它 解释 为 一 个 字 节 值 ， 因 为 它 可 表示 为 “055h”。 
CX 寄存 器 被 用 作 计 数 寄存 器 ， 用 于 循环 、 移 位 、 重 复 和 计数 操作 。 下 面 的 小 段 代码 说 明 
了 CX 寄存 器 的 作用 。 
MOV CX, 5 
myLoop: NOP 
LOOP myLoop 
LOOP 指 令 的 功能 与 568K 语 言 中 的 DBcc 指 令 相 似 。 但 是 ，LOOP 指 令 只 能 使 用 CX 寄存 器 作 
为 循环 计数 器 ,而 DBcc 指 令 则 可 以 使 用 任意 数据 寄存 器 作为 循环 计数 器 。 在 上 面 那 段 代码 中 ， 
NOP 指 令 将 被 执行 5 次 。 每 次 通过 循环 ，CX 寄 存 器 都 会 自动 递减 ， 当 <CX> = 0 时 循环 指令 将 
会 停止 执行 。 注 意 标号 “myLoop” 是 以 冒号 “:” 结 尾 的 。8086 汇 编 器 需要 一 个 冒号 来 指示 
这 是 一 个 标号 。 标 号 也 可 以 放 在 指令 或 数据 的 上 一 行 ; 
myLoop: NOP myLooPp:;: 
NOP 
这 两 个 是 等 价 的 。 
DX 寄存 器 是 唯一 可 以 用 来 指定 VO 地 址 的 寄存 器 。 由 于 8086 只 能 寻 址 64K 的 VO 位 置 ， 所 
以 不 要 求 O 具 有 空白 区 段 。 下 面 的 代码 片段 读 取 了 地 址 为 A43Eh 的 IO 端口 ， 并 将 数据 放 入 了 
AX 寄 存 器 。 
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MOV DX, OA43Eh 
IN AX,DX 


与 68K 不 同 ， 认 6 家 族 将 MO 作为 一 个 拥有 自己 总 线 信 号 集 和 定时 器 的 独立 存储 空间 来 处 理 。 

DX 寄 存 器 也 可 以 用 作 16 位 和 32 位 的 乘法 和 除法 操作 。 像 我 们 在 前 面 那个 例子 中 看 到 的 一 
样 ， 当 两 个 16 位 数 相 乘 产生 一 个 32 位 的 结果 时 ，DX 寄 存 器 与 AX 寄 存 器 将 连 在 一 块 使 用 。 类 
似 地 ， 当 除数 是 16 位 时 这 两 个 寄存 器 会 被 连 在 一 起 用 来 形成 一 个 32 位 的 被 除数 。 

MOV DX,0200 

MOV AX,0000 


MOV CX,4000 
DIV CX 


这 里 将 32 位 数字 的 被 除数 00C80000h 放 入 了 DX:AX， 除 数 为 CX 寄存 器 中 的 0FA0h。 两 数 
相 除 后 所 得 的 商 0CCCh 存 在 AX 中 ， 余 数 0C80h 存 在 DX 中 。 
目的 变 址 寄存 器 DI 和 源 变 址 寄存 器 SI 用 于 数据 移动 和 字符 串 操作 。 在 寻 址 源 操作 数 和 目 
的 操作 数 的 时 候 ， 每 个 寄存 器 都 有 专门 的 用 途 。DI 指 针 和 SI 指针 也 是 不 同 的 ， 因 为 在 进行 字 
符 串 操作 的 时 候 ，SI 寄 存 器 与 DS 段 寄存 器 配对 使 用 ，DI 与 ES 配对 使 用 。 当 进行 非 字 符 串 操作 
的 时 候 ， 它 们 都 与 DS 连 用 。 
这 看 起 来 可 能 很 奇怪 ， 但 这 是 合情合理 的 事 。 例 如 ， 当 你 想 要 在 两 个 独立 的 大 于 64K 的 存 
储 区 域 间 拷贝 一 个 字符 囊 时 ， 使 用 两 个 不 同 的 段 寄存 器 自然 就 给 了 你 最 大 可 能 的 存储 器 区 域 。 
下 面 的 代码 片段 从 DS:SI 最 初 所 指 的 存储 地 址 拷贝 了 5 个 字 节 到 ES:DI 所 指 的 存储 地 址 。 
MOV CX,0005 
MOV AX,1000h 
MOV BX,2000h 
MOV DS,AX 
MOV ES,BX 
MOV DI,200h 
MOV SI,100h 


ImYLooDp : MOVSB 
LOOP myLoop 


这 个 程序 将 DS 段 寄存 器 初始 化 为 1000h， 将 SI 段 寄 存 器 初始 化 为 100h。 因 此 将 要 拷贝 的 字 
符 串 定位 在 地 址 <1000:0100> ， 或 者 物理 存储 地 址 10100h 。 ES 段 寄 存 器 被 初始 化 为 2000h，DI 
寄存 器 被 初始 化 为 0200h， 因 此 目的 数 在 存储 器 中 的 物理 地 址 是 20200h。CX 寄 存 器 被 初始 化 
为 循环 计数 5， 指 令 ZOOP 使 得 MOVSB (移动 字符 串 字 节 ) 指令 执行 5 次 。MOVSB 指 令 每 运行 一 
次 ，DI 和 SI 寄存 器 的 内 容 都 会 自动 增加 1 个 字 节 。 

不 管 你 喜 不 喜欢 ， 这 些 都 是 功能 强大 且 简 洁 的 指令 。 

基 址 指针 和 堆栈 指针 (BP 和 SP) 通用 寄存 器 与 BIU 中 的 堆栈 段 (SS) 寄存 器 一 起 使 用 ， 
分 别 指向 堆栈 底 和 堆栈 顶 。 由 于 系统 栈 由 一 个 不 同 的 段 寄 存 器 管理 ， 所 以 需要 额外 的 偏 移 地 
址 寄存 器 来 指示 SS 所 指向 的 区 域 中 的 地 址 。 将 SP 寄存 器 看 作 就 是 这 个 堆栈 指针 ， 而 BP 寄存 器 
是 一 个 通用 的 存储 器 指针 ， 指 向 SS 段 寄存 器 所 指向 的 存储 区 域 。BP 被 高 级 语言 用 来 为 基于 堆 
栈 的 操作 提供 帮助 ， 例 如 参数 传递 和 局 部 变量 的 操作 。 从 某 种 意义 上 说 ， 当 高 级 语言 为 68K 而 
编译 时 ，SS 和 BP 的 结合 取代 了 局 部 帧 指针 (frame pointer) (通常 是 寄存 器 A6)。 

所 有 基于 堆栈 的 指令 (POP、POPA、POPF、PUSH、PUSHA 和 PUSHF ) 都 使 用 堆栈 指针 
(SP) 寄存 器 。SP 寄 存 器 总 是 被 用 作 从 堆栈 段 (SS ) 寄存 器 所 指向 的 地 址 到 当前 栈 地 址 的 一 
个 偏 移 值 。 

这 些 指 针 和 变 址 寄存 器 与 68K 中 对 应 的 寄存 器 有 一 个 重要 的 不 同 。 就 如 上 面 的 寄存 器 定义 
所 说 的 ， 这 些 寄存 器 可 以 与 BIU 中 的 段 寄 存 器 连用 以 形成 操作 数 的 物理 存储 地 址 。 我 们 很 快 就 
会 看 到 这 一 点 。 
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10.4 标志 寄存 器 


标志 寄存 器 中 的 一 些 位 与 68K 状 态 寄存 器 中 的 位 有 相似 的 定义 ， 基 他 的 位 则 不 同 。 而 且 ， 
这 些 标志 的 置 位 和 复位 比 68K 体 系 结构 中 的 更 严格 。 一 条 指令 执行 完 后 ， 这 些 标志 可 能 会 被 置 
位 为 1， 清 空 或 者 复位 为 0， 也 可 能 未 变 或 者 未 定义 。 未 定义 意味 着 一 条 指令 执行 前 的 标志 值 
可 能 不 被 保留 ， 指 令 执行 后 的 标志 值 不 能 预知 ?。 
。 位 0: 进位 标志 (CF)， 加 法 的 高 位 进位 操作 或 者 减法 的 高 位 借 位 操作 都 会 将 其 置 位 ， 
否则 清 零 。 
。 位 1; 保留 的 。 
。 位 2: 奇偶 标志 (PF)， 如 果 一 个 结果 的 低 8 位 中 包含 偶数 个 1 (奇偶 性 为 偶数 ) 就 置 
位 ， 否则 清 零 (奇偶 性 为 奇数 )。 
。 位 3; 保留 的 。 
。 位 4: 辅助 进位 标志 (AF)， 当 通用 寄存 器 AL 中 的 低 4 位 有 进位 或 借 位 时 置 位 ， 否 则 清 零 。 
位 5: 保留 的 。 
。 位 6: 零 标 志 (ZF)， 如 果 结 果 为 0 则 置 位 ， 否 则 清 零 。 


当 MSB = 1 时 则 置 为 1 (结果 为 负数 )。 

位 8: 陷阱 标志 (TF)， 当 TF 标志 被 置 为 1 的 时 候 ， 每 条 指令 执行 后 都 会 有 一 个 陷阱 中 断 
发 生 。TF 标 志 是 在 处 理 器 状态 标志 被 压 栈 后 自动 被 陷阱 中 断 清 零 的 。 当 从 中 断 指令 
(IRET) 返回 时 ， 陷 阱 服务 程序 能 通过 将 标志 退出 而 继续 执行 陷阱 。 因 此 ， 这 个 标志 实 
现 了 单 步 机 制 的 调试 。 

位 9: 中 断 使 能 标志 (IE)， 当 置 为 1 的 时 候 ， 就 允许 可 屏 藏 的 或 者 低 优先 级 的 中 断 ， 而 
且 可 能 中 断 处 理 器 。 当 中 断 发 生 时 ，CPU 将 控制 转移 到 中 断 向 量 (指针) 指向 的 存储 
地 址 。 

。 位 10: 方向 标志 (DRF)，DF 标 志 的 置 位 使 得 字符 串 指 令 自 动 递 增 相 关 的 变 址 寄存 器 。 
标志 的 清 零 则 使 得 指令 自动 递减 寄存 器 。 

位 11: 溢出 标志 (OF)， 如 果 带 符号 的 结果 不 能 在 目的 操作 数 的 位 数 范围 内 表示 则 置 
位 ， 否则 清 零 。 

。 位 12~15: 保留 的 。 


10.5 段 寄 存 器 


这 4 个 16 位 段 寄 存 器 是 BIU 的 一 部 分 ， 它 们 存放 着 操作 数 地 址 的 段 (页 ) 值 。 这 些 寄存 器 
(CS、DS、ES 和 SS) 定义 了 存储 器 的 段 ， 而 这 些 段 对 于 代码 或 取 指令 (CS)、 数 据 读 写 (DS 
和 ES) 以 及 基于 栈 的 操作 (SS) 来 说 是 可 立即 寻 址 的 。 


10.6 指令 指针 (IP) 


指令 指针 寄存 器 包含 下 一 条 即将 执行 的 顺序 指令 的 偏 移 地 址 。 因 此 ， 其 功能 与 68K 中 的 程 
序 计数 寄存 器 相同 。 不 能 直接 修改 IP 寄 存 器 。 像 PC 一 样 ， 引 起 转移 、 跳 转 和 子 程序 调用 的 非 
顺序 指令 将 会 改变 下 寄存 器 的 值 。 

这 些 寄存 器 的 描述 逐渐 为 我 们 引入 了 一 种 新 的 存储 器 寻 址 模式 ， 称 为 段 一 偏 移 寻 址 。 段 一 
偏 移 寻 址 在 很 多 方面 与 页 寻 址 相似 ， 但 与 我 们 在 这 本 书 前 面 所 讨论 的 页 寻 址 方法 并 不 完全 一 
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样 。 段 寄存 器 用 来 指向 任意 一 个 在 20 位 地 址 空间 中 存在 的 64K 的 16 字 节 边 界 〈 称 为 段 
(paragraph) ) 。 图 10-3 说 明了 地 址 是 怎么 形成 的 。 













物理 地 址 = ( 段 地 址 x 16) + 偏 移 地 址 


44443 


偏 移 地 址 ” 
物理 地 址 范围 


3333 





让 


图 10-3 基于 段 和 偏 移 模型 的 存储 器 寻 址 
从 这 个 模型 很 容易 看 出 ， 相 同 的 存储 地 址 可 以 用 很 多 种 不 同 的 方式 指定 。 这 在 某 些 方面 
与 68K 寻 址 模式 引起 的 混淆 问题 并 没有 太 大 的 区 别 ， 尽 管 对 你 来 说 在 这 一 点 上 68K 寻 址 模式 可 
能 看 起 来 更 直截了当 一 些 。 无 论 如 何 ，20 位 的 地 址 值 都 是 通过 取得 相应 段 寄存 器 的 16 位 地 址 


值 并 将 其 算术 左 移 4 位 而 得 到 的 。 由 于 每 一 次 左 移 都 相当 于 乘 以 2, 4 次 左 移 就 是 将 地 址 乘 以 16，- 


这 就 得 到 了 如 图 10-3 所 示 的 段 边界 的 基地 址 。 偏 移 值 是 指 以 段 寄 存 器 指定 的 段 边界 为 中 心 的 
正 位 移 值 或 负 位 移 值 。 图 10-3 说 明 从 一 个 值 为 9000h 的 段 寄存 器 能 够 访问 从 88000h 到 97FFFh 的 
物理 地 址 范围 。 从 0000h 到 7FFFh 的 偏 移 地 址 表示 正 位 移 (指向 高 地 址 ) ， 而 从 OFFFFh 到 8000h 


的 地 址 则 表示 负 位 移 。 


一 旦 段 边界 由 段 寄存 器 确定 后 ， 通 过 符号 扩展 得 到 的 偏 移 值 (或 者 是 字面 值 ， 或 者 是 寄 
存 器 内 容 ) 就 能 与 段 寄 存 器 的 移 位 值 相 加 而 形成 20 位 全 地 址 ， 如 图 10-4 所 示 。 


虽然 存储 操作 数 的 物理 地 址 是 20 位 
( 即 1MB) 的 ， 但 是 IO 空间 的 地 址 范围 
却 是 16 位 ( 即 64K) 的 。 当 寻 址 IO 设备 
时 高 4 位 没有 被 使 用 。 

你 应 该 开始 明白 的 一 点 是 对 于 大 多 
数 用 途 来 说 ， 存 储 器 中 的 物理 地 址 如 何 
实际 工作 并 没有 关系 。 大 多 数 你 将 使 用 
的 调试 工具 都 将 地 址 表示 成 了 段 : 偏 移 
形式 ， 所 以 你 没有 必要 去 试图 计算 存储 
器 中 的 物理 地 址 。 因 此 ， 如 果 给 你 的 地 
址 是 1000:0055， 那 么 你 可 以 只 关注 从 
1000h 开 始 的 段 中 偏 移 值 为 55h 的 地 址 。 
如 果 必 须 使 用 物理 存储 器 ， 那 么 你 可 以 


[1 2 A .4| 良 基地 址 | ， 
逻辑 
15 0 地 址 
偏 黎 地址 

0 


15 


[2 A 0: #4 
0 


19 


+ [0 0 2 人 加 人 
> 0 
物理 地 址 


19 0 
| 到 存储 器 
图 10-4 8086 体 系 结构 中 从 逻辑 地 址 到 物理 地 址 的 转换 





将 这 个 地 址 转换 为 10055h， 但 是 这 只 是 例外 ， 而 不 是 惯例 。 
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段 寄存 器 


正如 在 前 面 那些 例子 中 看 到 的 ， 在 BIU 中 有 4 个 段 寄 存 器 。 它 们 是 : 

。 代 码 段 (CS) 寄存 器 

。 数 据 段 (DS) 寄存 器 

。 堆栈 段 (SS) 寄存 器 

。 附 加 段 (ES) 寄存 器 

CS 寄存 器 是 从 存储 器 中 取 指 令 的 基 址 指针 寄存 器 。DS 寄 存 器 是 所 有 数据 操作 的 默认 段 寄 
存 器 。 然 而 你 已 看 到 ， 默 认 寄 存 器 能 够 用 一 个 汇编 寄存 器 作为 指令 操作 码 前 组 来 强制 修改 。 
很 明显 这 与 68K 是 不 相同 的 ， 这 种 体系 结构 想 有 一 个 清晰 的 划分 ， 区 分 哪些 是 取 来 作为 指令 的 
数据 ， 哪 些 是 取 来 作为 操作 的 数据 。 

堆栈 段 寄存 器 所 起 的 作用 类 似 于 在 68K 体 系 结构 中 与 SP 寄存 器 一 起 使 用 时 的 堆栈 指针 寄 
存 器 。BIU 中 的 最 后 一 个 寄存 器 是 附加 段 寄存 器 即 ES ， 这 个 寄存 器 为 基于 字符 串 的 操作 提供 
了 第 二 个 段 指针 。 

从 这 些 讨论 我 们 可 以 看 出 段 寄 存 器 的 行为 是 非常 严格 定义 的 。 由 于 它们 是 BIU 的 一 部 分 ， 
所 以 不 能 用 来 做 算术 操作 ， 而 且 它 们 的 内 容 只 能 由 寄存 器 到 寄存 器 的 传输 来 修改 。 按 照 CPU 
清楚 地 分 为 EU 和 BIU， 这 是 很 有 意义 的 。 

通过 这 些 代码 例子 ， 在 某 些 方面 我 们 已 经 超前 学 习 了 ， 目 的 是 在 专心 和 系统 地 学 习 8086 
指令 和 有 效 寻 址 模式 之 前 让 你 对 这 种 体系 结构 的 工作 方式 有 一 个 感性 认识 。 


10.7 存储 器 寻 址 模式 


8086 体 系 结构 提供 了 8 种 寻 址 模式 。 前 两 种 模式 对 存储 在 内 部 寄存 器 中 的 值 和 一 部 分 指令 
值 〈 立 即 值 ) 进行 操作 。 这 两 种 模式 是 ; 
1. 寄存 器 操作 数 模 式 : 操作 数 存放 在 一 个 8 位 或 者 16 位 寄存 器 中 。 寄 存 器 操作 数 模式 的 指 
令 例子 如 下 : 
MOV AX,DX 


MOV AL,BH 
INC AX 


2. 立即 操作 数 模式 : 操作 数 是 指令 的 一 部 分 。 立 即 操作 数 模式 的 例子 为 ; 


MOV AX,0AC10bh 
ADD AL,OAAh 


这 里 没有 用 “#” 之 类 的 符号 作为 前 绿 来 表明 操作 数 是 立即 数 。 

下 面 的 6 种 寻 址 模式 与 存储 操作 数 〈 即 存储 在 存储 器 中 的 数据 值 ) 一 起 使 用 。 这 些 有 效 的 
寻 址 模式 用 来 计算 和 构造 偏 移 地 址 ， 这 些 偏 移 地 址 与 段 寄 存 器 一 起 用 来 创建 用 于 查找 或 写 存 
储 数 据 的 实际 物理 地 址 。 物 理 存储 地 址 是 由 包含 在 段 寄存 器 中 的 逻辑 地 址 和 偏 移 值 合成 得 到 
的 ， 其 中 的 偏 移 值 不 一 定 包含 在 寄存 器 中 。 段 寄存 器 一 般 是 由 要 执行 操作 的 类 型 隐 含 地 选择 
的 。 因 此 ， 指 令 的 获取 与 CS 寄存 器 值 相关 ， 数 据 的 读 写 与 DS 寄存 器 相关 ， 堆 栈 操作 与 SP 寄存 
器 相关 ， 而 字符 串 操 作 与 ES 寄存 器 相关 。 寄 存 器 也 可 以 通过 在 指令 头 规定 一 个 期 望 的 寄存 器 
来 强制 修正 。 例 如 : 

ES;NMOV AX, [0005h] 

将 取得 ES:0005 而 不 是 DS:0005 处 的 数据 。 有 效 地 址 ( 偏 移 地 址 ) 可 以 通过 将 以 下 三 个 地 址 元 
素 相 加 而 得 到 : 

a. 一 个 作为 指令 一 部 分 的 8 位 或 者 16 位 的 立即 偏 移 值 。 
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b. 一 个 包含 在 BX 或 者 BP 寄存 器 中 的 基 址 寄存 器 值 。 

c. 一 个 存储 在 DI 或 者 SI 寄存 器 中 的 变 址 值 。 

3. 直接 模式 : 包含 的 存储 偏 移 值 是 一 个 8 位 或 者 16 位 的 正 位 移 值 。 

与 68K 不 同 ， 地 址 的 偏 移 部 分 总 是 一 个 正 数 ， 因 为 位 移 是 从 段 的 起 始 位 置 开 始 算 的 。 直 接 
模式 与 68K 的 绝对 寻 址 模式 最 相近 ， 但 是 不 同 的 地 方 在 于 总 是 需要 隐 含 的 段 寄存 器 来 构成 完整 
的 物理 地 址 。 例 如 ， 

MOV AX, [00RRh] 


将 数据 从 DS:00AA 拷 贝 到 AX 寄 存 器 ， 而 


CS :MOV DX, [OFCh] 
则 将 数据 从 CS:00FC 拷 贝 到 DX 寄 存 器 。 

注意 方 括号 是 用 来 符号 化 存储 指令 的 ， 没 有 括号 则 表示 是 立即 数 。 而 且 ，MOV 指 令 不 允 
许 两 个 存储 操作 数 。 指 令 

MOV [00AAh], [1000h] 
是 非法 的 。 与 68K 的 MOVE 指 令 不 同 ， 这 里 只 允许 一 个 存储 操作 数 。 

4. 寄存 器 间接 模式 ， 操 作 数 偏 移 被 包含 在 以 下 寄存 器 之 一 中 : 

e。 BP 

。BX 

。 DI 

。 SI 

方 括号 用 来 指示 间接 寻 址 。 下 面 的 代码 片段 将 值 55h 写 入 到 存储 地 址 DS:0100。 


MOV BX,100h 
MOV AL,55h 
MOV [BX] ,AL 


5. 基 址 模式 ， 存储 操作 数 是 基 址 寄存 器 BX 或 BP 的 内 容 与 8 位 或 16 位 位 移 值 的 和 。 下 面 的 
代码 片段 将 值 0AAh 写 人 到 存储 地 址 DS:0104。 


MOV BX,100h 
MOV AL,OAAh 
MOV [BX] 4,AL 


基 址 模式 指令 也 可 以 写成 : MOV [BX - 4],，AL。 

因为 位 移 既 可 以 是 正 数 也 可 以 是 负数 ， 所 以 上 面 的 指令 与 MOV[BX 0FFFCh] ,AL 等 价 。 

6. 变 址 模式 : 存储 操作 数 是 变 址 寄存 器 DI 或 SI 的 内 容 与 8 位 或 16 位 位 移 值 的 和 。 下 面 的 代 
码 片 段 将 值 VAAh 写 入 到 存储 地 址 ES:0104。 

MOV DI,100h 


MOV AL,OAAh 
MOV [DI]4,AL 


上 面 的 代码 说 明了 使 用 变 址 寄存 器 与 基 址 寄存 器 的 另 一 个 区 别 。DI 寄 存 器 默认 以 ES 寄存 
器 作为 它 的 源 地 址 段 ， 尽 管 ES 寄存 器 也 可 以 通过 在 指令 前 面 指 定 一 个 段 而 被 强制 修改 。 因 此 ， 
DS:MOV [DI+4]，AL 将 强制 指令 使 用 DS 寄存 器 而 不 是 ES 寄存 器 。 

7. 基 址 变 址 模式 : 存储 操作 数 的 偏 移 值 是 基 址 寄存 器 BP 或 BX 的 内 容 与 变 址 寄存 器 DI 或 SI 
的 内 容 之 和 。 在 变 址 模式 中 ，DI 寄 存 器 通常 与 ES 寄存 器 配对 使 用 ,但 是 当 DI 寄存 器 在 这 种 模 
式 下 使 用 时 ，DS 寄 存 器 是 默认 的 段 寄 存 器 。 下 面 的 代码 片段 将 值 0OAAh 写 入 到 存储 地 址 
DS:0200h。 
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MOV DXx,1000h 


MOV [DI+BX] ,AL 

指令 MOV [DI+BX] ,AL 也 可 以 写成 :; MOV [DI] [BX] ,AL。 

8. 带 位 移 的 基 址 变 址 模式 ， 存储 操作 数 的 偏 移 值 是 基 址 寄存 器 BP 或 BX 的 内 容 、 变 址 寄存 
器 DI 或 SI 的 内 容 以 及 一 个 8 位 或 16 位 的 位 移 值 三 者 的 和 。 在 变 址 方式 中 ，DI 寄 存 器 通常 与 ES 
寄存 器 配对 使 用 ， 但 是 当 DI 寄 存 器 在 这 种 方式 下 使 用 时 ，DS 寄 存 器 是 默认 的 段 寄 存 器 。 下 面 
的 代码 片段 将 值 0AAh 写 人 到 存储 地 址 DS:0204h。 


MOV DX,1000h 

MOV DS,DX 

MOV DI,100h 

MOV BX,DI 

MOV AL, OAAh 

MOV [DI+BX] 4,AL 

指令 MOV [DI+BX]4，AL 也 可 以 写成 : MOV [DI] [BX]4，AL 或 者 MOV [DI 
BX 4], AL, 

偏 移 值 的 计算 可 能 会 导致 一 个 非常 有 趣 而 微妙 的 代码 错误 。 请 查看 下 面 的 这 段 代 码 : 

MOV DX,1000h 

MOV DS,DX 

MOV BX,07000h 

MOV DI, OFFOh 

MOV AL,OAAh 

MOV [DI+BX+0Fh] ,AL 

这 段 代码 汇编 时 没有 错误 ， 而 且 将 值 0AAh 写 人 了 DS:7FFF。 物 理 地 址 是 17FFFh。 现 在 ， 
查看 另 一 段 代 码 : 
MOV DX,1000h 
MOV DS,DX 
MOV BX,07000h 
MOV DI, OFFOh 
MOV AL, OAAh 
MOV {DI+BX+10h] ,AL 


这 段 代 码 汇编 时 没有 错误 ， 而 且 将 值 0AAh 写 人 了 DS:8000。 然 而 ， 物 理 地 址 却 不 是 存储 
器 中 的 下 一 个 物理 位 置 18000h， 它 实际 上 是 08000h。 我 们 已 经 绕 过 了 偏 移 地 址 并 从 存储 地 址 
17FFFh 转 移 到 了 8000h。 如 果 我 们 已 经 在 一 个 循环 中 ， 并 正 要 写 一 个 连续 值 到 存储 器 中 ， 那 
我 们 可 能 就 得 调试 一 个 有 趣 的 问题 了 。 

可 以 将 存储 器 寻 址 模式 总 结 如 下 。 假 定 项 #1、#2 或 者 #3 是 可 选 的 ， 而 且 要 求 你 至 少 有 一 
种 表示 形式 来 指定 偏 移 值 。 这 看 起 来 很 有 道理 。 但 是 ， 我 们 要 记 住 ， 除 非 默认 段 寄 存 器 被 强 
制 修改 ， 否 则 DI 寄存 器 将 与 ES 寄存 器 配对 使 用 来 决定 物理 地 址 ， 而 其 他 三 个 寄存 器 则 使 用 DS 
段 寄存 器 。 不 过 ， 如 果 DI 寄 存 器 与 BX 或 BP 寄存 器 连用 ， 那 么 DS 就 是 默认 的 段 寄 存 器 。 
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10.8 x86 指 令 格 式 


条 8086 指 令 可 能 短 至 一 个 字 节 也 可 能 长 至 几 个 字 节 。 所 有 的 汇编 语言 指令 都 遵循 如 图 
10-5 所 示 的 格式 。 每 个 域 解释 如 下 : 

1. 指令 前 级 : 某 些 字符 串 操作 指令 在 以 REP、REPE、 指令 前 级 十 | 
REPZ、REPNE 以 及 REPN2Z 作 为 前 级 时 可 以 重复 执行 。 上段 超越 前 级 [ |] 
当然 也 有 前 绷 项 用 于 指定 总 线 锁定 (BUS LOCK) 信号 换 fm[C [CC 


























到 外 部 接口 。 操作 数 地 址 Fe 
2. 段 超越 前 级 : 为 了 强制 修正 计算 存储 操作 数 地 址 wb Py 
的 默认 段 寄 存 器 ， 段 超越 字 节 前 缀 被 添加 到 指令 的 开始 ed = 
处 。 只 可 以 使 用 一 个 段 超越 前 级 。 自 超越 的 格式 如 图 ew 
j0 6 图 10-5 8086 指 令 格式 
晤 局 吕 中 司 呈 
人 
| 
CC 
11= DS 
图 10-6 段 超越 前 缀 格式 图 10-7 操作 数 地址 字 节 的 格式 


3. 操作 码 : 操作 码 域 指定 指令 的 机 器 语言 操作 代码 。 大 多 数 操作 码 的 长 度 是 一 个 字 市 ， 
尽管 有 些 指 令 需 要 第 二 个 操作 码 字 节 。 

4. 操作 数 地 址 :操作 数 地 址 字 节 有 点 棘手 。 这 个 字 节 的 格式 如 图 10-7 所 示 ， 一 共有 三 个 
域 ， 分 别 标 为 mod、aux 和 rm。 操 作 数 地址 字 节 控制 指令 的 寻 址 形式 。 





mod 域 的 定义 如 下 : 
DB7 DB6 描述 
1 1 r/m 被 当 作 寄存 器 域 
0 0 DISP 域 =0，disp-low 和 disp-high 为 空 
0 I DISP 域 = 扩展 到 16 位 的 带 符号 disp-low，disp-high 为 空 
1 0 DISP 域 =disp-high:disp-low 


mod (修饰 符 ) 域 与 rm 域 连 用 可 以 决定 rm 域 是 怎样 被 解释 的 。 如 果 mod=11， 那 么 rm 域 
被 解释 为 一 个 寄存 器 操作 数 。 对 于 一 个 存储 操作 数 ，mod 域 则 用 来 决定 该 存储 操作 数 是 直接 
寻 址 还 是 间接 寻 址 。 对 于 间接 寻 址 的 操作 数 ，mod 域 用 来 指定 指令 中 的 字 节 数 和 位 移 。 

寄存 器 /存储 器 (rm) 域 指定 操作 数 是 一 个 寄存 器 还 是 一 个 存储 地 址 。 操 作 数 的 类 型 是 
由 mod 域 指定 的 。 如 果 mod 位 是 11， 那 么 rm 域 则 被 当 作 是 寄存 器 标识 。 如 果 mod 域 是 00、10 
或 者 01， 那 么 rm 域 则 指定 一 种 我 们 以 前 讨论 过 的 有 效 寻 址 模式 。rm 域 值 可 以 总 结 如 下 : 


DB2 DB1 DB0 有 效 地 址 


[BP] + DISP (如 果 mod=00， 那 么 EA= disp-high:disp-low) 
[BX] + DISP 


-一 


0 0 0 [BX] + [ST] + DISP 
0 0 1 [BX] + [DI] + DISP 
0 | 0 [BP] + [SI] + DISP 
0 1 1 [BP] + [DI] + DISP 
1 0 0 [SI + DISP 

1 0 1 [DI] + DISP 

1 1 0 

1 1 





0 


当 r/m 被 用 来 指定 寄存 器 时 ， 位 码 如 下 : 


DB2 DB1 DB0 字 字 节 
0 0 0 AX AL 
0 0 1 CX CL 
0 1 0 DX DL 
0 1 1 BX BL 
1 0 0 SP AH 
1 0 1 BP CH 
1 1 0 SI DH 
1 1 1 DI BH 


从 上 表 可 以 看 出 寄存 器 的 位 码 是 怎样 随 着 指令 中 操作 数 的 大 小 而 改变 的 。 操 作 数 的 大 小 
是 由 指令 的 操作 码 这 部 分 决定 的 。 我 们 马上 就 会 看 到 这 是 怎么 工作 的 。 

辅助 域 (aux) 有 两 种 用 途 。 某 些 指令 在 需要 的 时 候 可 能 要 求 有 一 个 操作 码 扩展 域 ， 这 种 
扩展 域 就 包含 在 aux 域 中 。 另 外 ， 当 指令 需要 指定 第 二 个 寄存 器 操作 数 时 ， 辅 助 域 就 用 于 根据 
上 表 来 指定 第 二 个 寄存 器 。 

5. 位 移 ; 位 移 值 是 一 个 在 有 效 地 址 计算 中 要 加 到 偏 移 部 分 的 8 位 或 16 位 数 。 

6. 立 即 数 : 立即 数 域 包 含 多 至 2 字 节 的 立即 数 。 

和 你 看 到 的 一 样 ，8086 指 令 格 式 比 68K 指 令 格 式 确实 要 复杂 一 些 。 很 多 复杂 性 可 以 归根 于 
段 : 偏 移 的 地 址 格式 ， 但 这 并 不 是 全 部 的 原因 。 我 们 应 该 将 8086 体 系 结构 作为 一 个 整体 来 考虑 ， 
以 便 了 解 位 模式 是 怎样 用 来 创建 微 代 码 中 的 路 径 的 ， 这 决定 了 指令 的 状态 机 路 径 。 最 后 一 个 
要 考虑 的 难题 是 指令 的 操作 码 部 分 。 

回忆 一 下 ， 在 68K 体 系 结构 中 ， 指 令 的 操作 码 部 分 可 以 很 容易 地 被 剖析 为 位 的 固定 模式 : 
一 个 寄存 器 域 、 一 个 模式 域 以 及 一 个 有 效 地 址 域 。 在 8086 体 系 结构 中 ， 区 别 没有 那么 明显 ， 
控制 也 更 加 分 散 。 让 我 们 考虑 一 下 MOV 指令 的 可 能 操作 码 。 下 面 的 表 中 列举 了 可 能 的 指令 代 
码 。 操 作 码 列 中 以 斜 杠 “/” 开 头 的 值 是 操作 数 地 址 字 节 中 的 辅助 域 的 值 。 操 作 码 列 中 紧 跟 在 
加 号 “二 ”后 的 值 是 要 加 到 操作 码 基 本 值 上 的 寄存 器 码 。 





格 式 操作 码 描 述 
‘MOV r/m8, r8 88 /r 将 存储 在 寄存 器 /r 中 的 字 节 值 拷贝 到 寄存 器 或 存储 器 字 节 rm8 
MOV r/m16, r16 89 /r 将 存储 在 寄存 器 /r 中 的 字 值 拷贝 到 寄存 器 或 存储 器 字 Uml16 
MOV r8, r/m8 8A Ar 将 存储 在 rm8 中 的 字 节 值 拷贝 到 字 节 寄存 器 rr 中 
MOV r16, r/m16 8B /r 将 存储 在 寄存 器 或 存储 器 字 r/m16 中 的 值 措 贝 到 字 寄 存 器 /中 
MOV r/m16, sreg 8C /sr 将 段 寄 存 器 /sr 拷贝 到 寄存 器 或 存储 器 字 r/m16 
MOV sreg, r/mi6 8E /sr 将 寄存 器 或 存储 器 字 rm16 拷 贝 到 段 寄 存 器 
MOV AL, moffs8 AO 将 存储 在 存储 器 中 段 :moffs8 处 的 字 节 值 拷 贝 到 AL 寄存 器 
MOV RARX，moftfts16 Al 将 存储 在 存储 器 中 段 :moffs16 处 的 字 值 拷贝 到 AX 寄 存 器 
MOV moffs8, AL A2 将 AL 寄 存 器 中 的 内 容 拷贝 到 存储 器 中 地 址 为 段 :moffs8 的 字 节 处 
MOV moffs16, AX A3 将 AX 寄 存 器 中 的 内 容 拷贝 到 存储 器 中 地 址 为 段 :moffs16 的 字 节 处 
MOV r8, imm8 BO+rb 将 立即 数字 节 imm8 拷 贝 到 寄存 器 rb 
MOV r16, imm16 B8 + rw 将 立即 数字 imml16 找 贝 到 寄存 器 rw 
MOV r/m8, imm8 C6 /0 | 将 立即 数字 节 imm8 拷 贝 到 寄存 器 或 存储 器 字 节 rm8 


MOV r/m16, imm1i6 C7/0 将 立即 数字 imml16 拷 贝 到 寄存 器 或 存储 器 字 rm16 


通过 上 面 的 操作 码 ， 我 们 可 以 看 出 无 论 何 时 只 要 字 节 操作 被 指定 ， 那 么 操作 码 中 的 最 低 有 
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效 位 就 将 为 0。 相 反 ， 无 论 何 时 只 要 字 操 作 被 指定 ， 最 低 有 效 位 就 为 1!。 如 果 源 或 者 目的 是 一 个 
段 寄 存 器 ,那么 在 操作 数 地 址 字 节 aux 域 中 的 相应 段 寄存 器 DS、SS 或 者 ES 的 代码 将 分 别 是 011、 
010 或 者 000。 这 些 与 用 于 段 超 越位 的 代码 是 相同 的 。CS 寄 存 器 不 能 直接 通过 MOV 指 令 来 修改 。 

这 里 是 为 了 轻松 吸收 几 页 内 容 而 做 的 大 量 努 力 ， 所 以 让 我 们 把 它 放 在 一 起 ， 通 过 观察 一 
些 实际 指令 的 位 模式 来 判断 在 实际 上 它们 是 否 与 我 们 所 预言 的 一 致 。 


助 记 指令 机 器 码 mod aux r/m 
MOV AX,BX 8B C3 11 000 011 





操作 码 8Bh 告 诉 我 们 这 是 一 条 形式 为 MOV r/16, rrml16 的 MOV 指 令 。 目 的 寄存 器 是 字 寄 存 
器 AX。 而 且 ， 寄存器 在 aux 域 中 被 指定 且 它 的 值 为 000， 对 应 于 AX 寄 存 器 。mod 域 是 11， 这 
意味 着 r/m16 域 是 一 个 寄存 器 值 。r/m 域 的 值 为 011， 这 与 BX 寄存 器 相 匹 配 。 因 此 ， 我 们 对 指 
令 的 分 析 从 操作 码 的 适当 形式 开始 ， 这 将 会 把 我 们 引 至 操作 数字 节 的 适当 形式 。 

上 面 那 个 例子 是 非常 直接 的 ， 下 面 我 们 将 往 前 进 一 小 步 。 让 我 们 增加 段 超 越 和 存储 偏 移 。 


助 记 指令 机 器 码 mod aux rm 
ES:MOV [100h], CX 26 89 OE 00 01 00 001 110 


段 超越 字 节 26h 指 明了 ES 寄存 器 ， 操 作 码 89h 告 诉 我 们 这 是 形式 为 MOV r/m16， r16 的 
指令 。aux 域 告诉 我 们 源 寄存 器 是 CX (001) ， 而 mod 域 告诉 我 们 寄存 器 /存储 器 地 址 是 一 个 存 
储 器 位 置 ， 只 是 在 计算 偏 移 地 址 时 并 不 需要 位 移 值 。rm 域 值 110 意 味 着 存储 偏 移 值 为 disp- 
high:disp-low， 这 在 存储 器 中 被 存储 为 00 01 ( 低 端 字 节 序 ) 。 

最 后 一 个 例子 ， 我 们 将 把 它们 合 起 来 。 


助 记 指令 机 器 码 mod aux r/im 


CS:MOV [BX+DI+0AAh], 55h 2E C6 81 AA 00 55 10 000 001 


能 明白 该 指令 吗 ? 段 超越 字 节 意味 着 强制 指定 的 段 是 CS (01)。 操 作 码 C6h 告 诉 我 们 指令 

是 如 下 所 示 的 形式 : 
MOV r/m8 ,imm8 

操作 数 地 址 字 节 给 出 mod 值 10， 这 告诉 我 们 在 计算 偏 移 地 址 时 有 一 个 必须 使 用 的 位 移 域 ， 
而 且 它 的 形式 是 disp-high:disp-low， 我 们 可 以 从 后 面 的 两 个 字 节 AA 00 看 到 。r/m 域 值 001 告 诉 
我 们 计算 地 址 的 最 终 形式 为 ， [BX + DI + DISP]。 和 操作 码 的 格式 所 显示 的 一 样 ， 指 令 的 最 后 
一 个 字 节 55h 是 8 位 立即 数 imm8。 

如 果 我 们 将 指令 修改 如 下 : 

CS:MOV [BX+DI+OAAh] ,5555h 

指令 代码 就 会 变 为 2E C7 81 AA 00 55 55。 操 作 码 由 C6 变 为 C7， 意 味 着 是 一 个 字 操 作 ， 而 且 
该 立即 数 域 现在 是 两 个 字 节 长 。 现 在 整个 指令 的 长 度 是 7 个 字 节 ， 所 以 我 们 就 能 明白 为 什么 
8086 体 系 结构 必须 允许 存储 器 的 不 对 齐 访 问 ， 这 是 因为 如 果 当 前 指令 从 一 个 字 边 界 开始 ， 那 
么 下 一 条 指令 将 会 从 奇数 边界 开始 。 


10.9 8086 指 令 集 总 结 
虽然 详细 地 解释 所 有 8086 系 列 指令 已 经 超出 了 本 书 的 范围 ， 但 是 我 们 可 以 通过 学 习 并 使 
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用 每 一 类 中 的 代表 性 指令 来 得 到 对 所 有 指令 的 一 些 认 识 。 而 且 ， 其 中 一 些 指令 将 使 我 们 的 视 
野 扩 展 到 整体 的 8086 系 列 体系 结构 。 

我 们 可 以 把 最 原始 的 x86 指 令 集 划 分 为 以 下 的 指令 类 ; 

。 数 据 传送 指令 

*。 算 术 指 令 

* 逻辑 指令 

。 字 符 串 操作 指令 

“控制 转移 指令 

这 些 类 指令 中 的 大 多 数 对 你 来 说 都 比较 熟悉 了 ， 另 外 一 些 则 比较 生疏 。68K 系 列 指令 集中 
没有 用 于 循环 控制 或 者 字符 串 操 作 的 专用 指令 ， 很 难 估计 这 是 否 代表 体系 结构 的 一 个 缺点 。 
很 明显 ， 在 68K 体 系 结构 中 你 也 可 以 操作 字符 串 和 构成 软件 循环 。 现 在 让 我 们 看 看 每 一 类 中 的 
一 些 代 表 性 指令 。 


10.10 数据 传送 指令 


就 像 68K 系 列 中 的 MOVE 指 令 一 样 ，MOV 指 令 可 能 是 指令 集中 使 用 最 频繁 的 指令 。 在 这 一 
章 中 我 们 已 经 较 多 地 接触 了 MOV 指 令 ， 可 以 把 它 作 为 了 解 x86 指 令 集 体系 结构 如 何 运作 的 一 条 
原型 指令 。 我 们 可 以 将 数据 转移 类 中 的 指令 总 结 为 下 面 的 表格 "。 注 意 并 不 是 所 有 的 指令 都 列 
举 出 来 了 ， 一 些 指令 还 有 其 他 一 些 具 有 独特 助 记 符 的 变型 。 这 个 表 是 用 来 总 结 最 常用 类 型 的 。 














助 记 符 (Intel) 指 令 描述 

MOV 移动 从 一 个 源 操作 数据 贝 数据 到 一 个 目的 操作 数 

PUSH 压 栈 为 一 个 栈 中 操作 数 创建 存储 空间 并 将 操作 数 
拷贝 到 栈 里 

POP 退 栈 拷贝 栈 顶 元 素 到 存储 器 或 寄存 器 

XCHG 交换 交换 两 个 操作 数 

IN 输入 从 LO 空间 地 址 读数 据 

OUT 输出 写 数 据 到 1/O 空 间 地 址 

XLAT 解释 将 存储 器 中 字 节 的 偏 移 地 址 转换 为 字 节 值 

LEA 载 信 有 效 地 址 计算 一 个 数据 元 素 的 有 效 地 址 偏 移 并 将 该 值 
载 人 一 个 寄存 器 

LDS 将 段 载 人 DS ， 偏 移 载 人 寄存 器 读 取 在 存储 器 中 以 一 个 32 位 双 字 存储 的 全 地 
址 指针 ， 将 段 部 分 存在 DS 中 ， 偏 移 部 分 存在 一 
个 寄存 器 中 

LES 将 段 载 和 ES， 偏 移 载 和 人 寄存 器 除了 存储 器 指针 的 段 部 分 是 载 人 ES 而 不 是 
DS 之 外 ， 与 LDS 相 同 

LAHF 标志 载 人 AH 将 处 理 器 状态 寄存 器 的 标志 部 分 拷贝 到 AH 寄 
存 器 

SAHF AH 存 人 标志 将 AH 寄 存 器 中 的 内 容 拷贝 到 处 理 器 状态 寄存 
器 的 标志 部 分 

PUSHF 标志 压 栈 在 栈 上 创建 空间 并 将 处 理 器 状态 寄存 器 中 的 

POPF 标志 退 栈 将 栈 顶 的 数据 拷贝 到 处 理 器 状态 寄存 器 的 标 
志 部 分 并 从 栈 上 移 除 存储 空间 


检查 一 下 数据 传送 指令 集 ， 我 们 发 现 除 了 XLAT、IN 和 OUT 指 令 之 外 其 他 指令 都 在 68K 指 
令 集中 有 类 似 的 指令 。 
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10.11 算术 指令 
下 面 这 张 表 总 结 了 8086 的 算术 指令 。 
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描述 
两 个 整数 或 无 符号 数 相 加 
两 个 整数 或 无 符号 数 与 进位 标志 的 内 容 一 起 相 加 
寄存 器 内 容 或 存储 器 值 增加 1 


将 两 个 非 压缩 BCD 数 的 无 符号 二 进 制 和 转换 为 等 价 的 非 压 
缩 十 进 制 数 

将 加 法 结果 的 8 位 无 符号 值 转换 为 等 价 的 BCD 数 

两 个 整数 或 无 符号 数 相 减 

减 去 一 个 整数 或 一 个 无 符号 数 ， 以 及 一 个 相同 类 型 数字 的 
进位 标志 的 内 容 

一 个 寄存 器 或 存储 器 位 置 的 内 容 减 1 








助 记 符 (Intel) 指 令 
ADD 加 
ADC 带 进位 加 
INC 递增 
AAA 加 后 ASCII 调 整 AL 
DAA [ 进 制 加 调整 
SUB 减 
SBB 带 借 位 减 
DEC 递减 
NEG 取 补 
CMP 比较 
AAS 减 后 ASCII 调 整 
DAS 减 后 十 进 制 调整 
MUL 乘 
IMUL 整数 乘 
AAM 乘 后 ASCII 调 整 
DIV 除 
IDIV 整数 除 
AAD 除 后 ASCII 调 整 
CWD 字 转 换 为 双 精 度 
CBW 字 节 转换 为 字 


除了 4 个 用 于 将 BCD 数 字 转 换 为 易 转 化 为 等 价 ASCII 码 的 ASCII 调 整 指令 之 外 ， 上 面 所 有 


的 指令 都 在 68K 指 令 集中 有 类 似 的 指令 。 
10.12 逻辑 指令 





将 一 个 寄存 器 或 存储 器 的 内 容 赫 换 为 它 的 补 码 


两 个 整数 或 者 无 符号 数 相 减 并 设置 相应 的 标志 ， 但 不 保存 
减法 的 结果 。 源 操作 数 和 目的 操作 数 都 不 会 改变 


将 两 个 非 压 缩 BCD 数 的 无 符号 二 进 制 差 转换 为 等 价 的 非 压 
缩 十 进 制 数 


将 减法 结果 的 8 位 无 符号 值 转换 为 等 价 的 BCD 数 
两 个 无 符号 数 相 乘 
两 个 带 符号 数 相 乘 


将 两 个 非 压缩 BCD 数 的 无 符号 二 进 制 积 转换 为 等 价 的 非 压 
缩 十 进 制 数 


两 个 无 符号 数 相 除 
两 个 带 符号 数 相 除 


将 两 个 非 压缩 BCD 数 的 无 符号 二 进 制 商 转换 为 等 价 的 非 压 
缩 十 进 制 数 


将 一 个 16 位 的 整数 转换 为 符号 扩展 的 32 位 整数 
将 一 个 8 位 的 整数 转换 为 符号 扩展 的 16 位 整数 


下 面 这 张 表 总 结 了 8086 的 逻辑 指令 。 

助 记 符 (Intel) 指 令 描述 
NOT 取 反 寄存 器 或 存储 器 操作 数 取 反 
逻辑 左 移 ‘SHL 和 SAL 位 立 用 0 
SAL 算术 去 移 和 SAL 将 操作 数 各 位 左 移 ， 空 位 用 0 填充 ， 高 位 移 人 到 CF 中 
SHR 逻辑 右 移 将 操作 数 的 各 位 右 移 ， 空 位 用 0 填充 ， 低 位 移 人 到 CF 中 
SAR 算术 右 移 将 操作 数 的 各 位 右 移 ， 空 位 用 原来 的 最 高 位 填充 ， 低 位 移 人 到 CF 中 
ROL 循环 左 移 将 操作 数 的 各 位 循环 左 移 ， 高 位 移入 到 CF 和 低位 中 


ROR 循环 右 移 将 操作 数 的 各 位 循环 右 移 、 低 位 移入 到 CF 和 高 位 中 
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( 续 ) 
动 记 符 (Intel) 指令 描 述 

RCL 通过 进位 位 循环 左 移 将 操作 数 的 各 位 循环 左 移 ， 高 位 移入 到 CF 中 ， 而 CF 的 内 
容 移入 到 低位 中 

RCR 通过 进位 位 循环 右 移 将 操作 数 的 各 位 循环 右 移 ， 低 位 移 人 到 CF 中 ， 而 CE 的 内 
容 移入 到 高 位 中 

AND 按 位 与 计算 两 个 操作 数 的 按 位 逻辑 与 

TEST 逻辑 比较 判断 一 个 操作 数 的 特定 位 是 否 为 1。 结 果 不 保存 ， 只 有 标 
志 受 到 影响 

OR 按 位 或 计算 两 个 操作 数 的 按 位 逻辑 或 

XOR 异 或 计算 两 个 操作 数 的 按 位 逻辑 异 或 





可 以 看 出 ， 逻 辑 指 令 类 与 68K 系 列 中 的 对 应 指令 非常 接近 。 


10.13 字符 串 操作 


这 一 组 指令 在 68K 体 系 结构 中 没有 对 应 的 指令 ， 它 们 提供 了 一 组 功能 强大 而 简洁 的 字符 串 
操作 。 下 面 的 表格 总 结 了 8086 的 字符 串 操 作 指 令 。 





助 记 符 (Intel) 指 令 描述 

REP 重复 重复 执行 一 条 简单 的 字符 串 指令 

MOVS 移动 一 个 字符 串 成 员 从 一 个 地 址 拷贝 字符 串 的 一 个 字 节 
(MOVSB) 或 字 (MOVE SW) 到 另 一 个 地 址 

CMPS 比较 一 个 字符 串 成 员 将 一 个 字符 串 的 一 个 字 节 (CMPSB) 或 字 
(CMPSW) 与 第 二 个 字符 串 的 字 节 或 字 进行 
比较 

SCAS 扫描 一 个 字符 串 寻 找 成 员 将 一 个 字符 串 的 一 个 字 节 (SCASB) 或 字 
(SCASW) 与 一 个 寄存 器 的 值 进行 比较 

LODS 载 人 字符 串 成 员 拷贝 一 个 字符 串 中 的 字 节 (LODSB) 或 字 
(LODSW) 到 AL ( 字 节 ) 或 AX ( 字 ) 寄存 器 

STOS 存储 字符 串 成 员 拷贝 AL ( 字 节 ) 或 AX ( 字 ) 寄存 器 中 的 字 


节 (STOSB) 或 字 (STOSW) 到 一 个 字符 串 





重复 (REPEAT) 指令 还 有 几 种 上 面 表 格 中 没有 列举 的 变化 形式 。 像 68K 中 的 DBcc 指 令 
一 样 ， 指 令 的 重复 取决 于 标志 寄存 器 中 其 中 一 位 的 值 。 这 组 指令 如 何 很 容易 地 实现 C 和 C++ 库 
中 的 字符 串 操 作 指 令 是 显而易见 的 。 

重复 指令 是 很 独特 的 ， 因 为 它 并 没有 作为 一 个 单独 的 操作 码 使 用 ， 而 是 放置 在 需要 重复 
的 其 他 字符 串 指令 前 面 。 因 此 ， 


REPMOVSB 


将 使 得 MOVSB 指 令 重复 CX 寄 存 器 中 存储 的 次 数 。 而 且 ，MOVS 指 令 自动 增加 或 减少 DI 和 SI1 
寄存 器 的 内 容 ， 所 以 ， 为 了 进行 一 次 字符 串 拷贝 操作 ， 你 应 该 做 以 下 几 步 ， 

1. 初始 化 方向 标志 DF。 

2. 初始 化 计数 寄存 器 CX。 

3. 初始 化 源 变 址 寄存 器 SI。 
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4. 初始 化 目的 变 址 寄存 器 DI。 
5. 执行 REPMOVSB 指 令 。 
将 这 个 与 68K 指 令 集中 的 相应 操作 相 比较 ， 在 68K 中 没有 方向 标志 要 设置 ， 但 是 步骤 2~4 
都 需要 执行 相 类 似 的 操作 。 自 动 递增 和 自动 增 减 的 寻 址 模式 将 与 MOVE 指 令 一 起 使 用 ， 所 以 
你 应 当 用 下 面 的 指令 来 模仿 MOVSB 指 令 : 
MOVE.B (A0)+,(Al1)+ 


不 同 的 是 你 需要 有 一 条 额外 的 指令 例如 DBcc 作 为 你 的 循环 控制 器 。 这 是 否 意 味 着 在 这 种 字符 
串 拷贝 操作 中 8086 会 比 68K 更 好 呢 ? 在 没有 深入 地 分 析 前 还 很 难说 。 因 为 REPMOVSB 是 一 条 
相当 复杂 的 指令 ， 有 理由 认为 它 比 一 条 更 简单 的 指令 占用 了 更 多 的 时 钟 周期 。 来 自 AMD 的 
186EM“ 处 理 器 需要 占用 8+8 x n 个 时 钟 周期 来 执行 这 条 指令 ， 这 里 n 是 指令 重复 的 次 数 。 因 此 ， 
这 条 指令 在 两 个 存储 器 位 置 之 间 拷贝 100 个 字 节 时 最 少 需要 占用 808 个 时 钟 周 期 。 然 而 ， 为 了 
执行 68K 的 MOVE 和 DBcc 指 令 对 ， 我 们 还 需要 反复 地 从 存储 器 中 取 每 一 条 指令 ， 所 以 存储 器 
取 指 令 的 开销 在 比较 中 占 很 大 部 分 。 


10.14 控制 转移 














助 记 符 (Intel) 描述 

CALL 挂 起 当前 指令 序列 的 执行 ， 保 存 下 一 条 指令 的 段 如 
果 必 要 ) 和 偏 移 ， 并 将 执行 转移 到 操作 数 所 指向 的 指令 

JMP 无 条 件 跳 转 停止 当前 指令 序列 的 执行 ， 将 控制 转移 到 操作 数 所 
指向 的 指令 

RET 从 过 程 返回 与 CALL 指 令 连用 ，RET 指 令 恢复 地 寄存 器 的 内 容 ， 
也 可 能 恢复 CS 寄存 器 的 内 容 

正 若 相 等 则 跳 转 如 果 零 标志 (ZF) 置 位 ， 控 制 将 被 转移 到 操作 数 所 

芭 指向 的 指令 地 址 。 如 果 ZF 被 清 零 ， 该 指令 被 忽略 


iL 车 小 于 则 跳 转 如 果 符 号 标志 (SF) 和 溢出 标志 (OF) 不 一 样 ， 那 


JNGE 若非 大 于 等 于 则 跳 转 么 控制 将 被 转移 到 操作 数 所 指向 的 指令 地 址 。 如 果 它 
们 相同 ， 该 指令 被 忽略 








JB 若 低 于 则 跳 转 如 果 进位 标志 (CF) 被 置 位 ， 控 制 将 被 转移 到 操作 
JNAE 若非 高 于 等 于 则 跳 转 | ” 数 所 指向 的 指令 地 址 。 如 果 CF 被 清 零 ， 该 指令 被 忽略 
区 

JBE 如 果 进 位 标志 (CF) 或 者 零 标志 (ZF) 被 置 位 ， 控 





JNA 若 不 高 于 则 跳 转 制 将 被 转移 到 操作 数 所 指向 的 指令 地 址 。 如 果 CF 和 ZF 
都 被 清 零 ， 该 指令 被 忽略 


JP 若 为 奇数 则 跳 转 如 果 奇 偶 标志 (PF) 被 置 位 ， 控 制 将 被 转移 到 操作 





JPE 数 所 指向 的 指令 地 址 。 如 果 PF 被 消 零 ， 该 指令 被 忽略 
Jo 若 溢 出 则 跳 转 如 果 溢 出 标志 (OF) 被 置 位 ， 控 制 将 被 转移 到 操作 
数 所 指向 的 指令 地 址 。 如 果 OF 被 清 零 ， 该 指令 被 忽略 
JS 车 有 符号 则 跑 转 如 果 符 号 标志 (SF) 被 置 位 ， 控 制 将 被 转移 到 操作 
数 所 指向 的 指令 地 址 。 如 果 SF 被 清 零 ， 该 指令 被 忽略 
JNE 若 不 相等 则 跳 转 如 果 零 标志 (ZF) 被 清 零 ， 控 制 将 被 转移 到 操作 数 





JNZ 若非 零 则 跳 转 所 指向 的 指令 地 址 。 如 果 ZF 被 置 位 ， 该 指令 被 忽略 
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( 续 ) 
助 记 符 (Intel) 指 令 描述 
JNL 若 不 小 于 则 跳 转 如 果 符 号 标志 (SF) 和 溢出 标志 (OF) 一 样 ， 那 么 
JGE 车 大 于 等 于 则 跳 转 控制 将 被 转移 到 操作 数 所 指向 的 指令 地 址 。 如 果 它 们 
不 相同 ， 该 指令 被 忽略 
JNLE 车 非 小 于 等 于 则 跳 转 如 果 人 逻辑 表达 式 ZF * (SF XOR OF) 取 值 为 真 ， 那 么 
JG 车 大 于 则 跳 转 控制 将 被 转移 到 操作 数 所 指向 的 指令 地 址 。 如 果 该 表 
达 式 取 值 为 假 ， 该 指令 被 忽略 
JNB 车 不 低 于 则 跳 转 如 果 进 位 标志 (CF) 被 清 零 ， 控 制 将 被 转移 到 操作 


JAE 车 高 于 等 于 则 跳 转 数 所 指向 的 指令 地 址 。 如 果 CF 被 置 位 ， 该 指令 被 忽略 










若非 低 于 等 于 则 跳 转 





如 果 进 位 标志 (CF) 或 者 零 标 志 (ZF) 都 被 清 零 ， 














IA 若 高 于 则 跳 转 控制 将 被 转移 到 操作 数 所 指向 的 指令 地 址 。 如 果 其 中 
| 一 个 标志 被 置 位 ， 该 指令 被 忽略 

JNP 若非 奇数 则 跳 转 如 果 奇 个 标志 (PF) 被 清 零 ， 控 制 将 被 转移 到 操作 

JO 车 为 奇数 则 跳 转 数 所 指向 的 指令 地 址 。 如 果 PF 被 置 位 ， 该 指令 被 忽略 

JNO 如 果 没 有 溢出 则 跳 转 如 果 溢出 标志 OF) 被 清 零 ， 控 制 将 被 转移 到 操作 
数 所 指向 的 指令 地 址 。 如 果 OF 被 置 位 ， 该 指令 被 忽略 

JNS 若 无 符 号 则 跳 转 如 果 符 号 标志 (SF) 被 清 零 ， 控 制 将 被 转移 到 操作 
数 所 指向 的 指令 地 址 。 如 果 SF 被 置 位 ， 该 指令 被 忽略 

LOOP 重复 执行 一 个 指令 序列 。 循 环 执行 的 次 数 存储 在 CX 

循环 寄存 器 中 

LOOPZ 重复 执行 一 个 指令 序列 。 循 环 重复 的 最 大 次 数 存储 

LOOPE 在 CX 寄存 器 中 。 如 果 零 标志 (ZF) 被 置 位 ， 循 环 在 
CX 计数 减 到 0 之 前 停止 

LOOPNZ 重复 执行 一 个 指令 序列 。 循 环 重复 的 最 大 次 数 存 售 

LOOPNE 在 CX 寄存 器 中 。 如 果 零 标志 (ZF) 被 清 零 ， 循 环 在 
CX 计数 减 到 0 之 前 停止 

JCXZ 如 果 前 面 的 指令 在 CX 寄存 器 中 留 下 的 是 9， 那 么 榨 
制 被 转移 到 操作 数 所 指向 的 指令 地 址 

INT 产生 中 断 当前 指令 序列 被 挂 起 ， 处 理 器 状态 标志 、 指 令 指 针 
(IP) 寄存 器 和 CS 寄存 器 压 槛 。 指 令 从 存储 在 相应 中 断 
向 量 位 置 的 存储 地 址 处 接着 执行 

IRET 恢复 标志 寄存 器 、IP 寄 存 器 和 CS 寄存 器 的 内 容 


尽管 可 能 的 条 件 跳 转 指 令 的 列表 很 长 而 且 印 象 深 刻 ， 但 是 你 应 当 注 意 到 大 多 数 助 记 指令 
都 是 同义词 并 且 测 试 的 是 相同 的 状态 标志 条 件 。 而 且 ， 由 于 存储 器 寻 址 使 用 的 是 段 方法 ， 所 
以 跳 转 类 型 (JUMP-type) 的 指令 集 还 需要 进一步 的 解释 。 

跳 转 可 以 分 为 两 类 ， 依 据 是 跳 转 的 目的 地 址 离 跳 转 指令 当前 地 址 的 远近 。 如 果 打 算 跳 转 
到 CS 寄存 器 当前 值 所 指 的 存储 区 域 的 另 一 个 地 址 ， 那么 你 要 执行 的 是 一 次 段 内 跳 转 
(intrasegment jump)。 相 反 ， 如 果 跳 转 的 目的 地 址 超出 了 CS 指针 所 指 的 区 域 ， 那 么 你 要 执行 
的 是 一 次 段 间 跳 转 (intersegment jump)。 段 间 跳 转 要 求 CS 寄存 器 也 被 修改 以 使 跳 转 指令 可 以 
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覆盖 物理 存储 器 的 整个 范围 。 
跳 转 操作 数 可 以 有 几 种 形式 。 下面 是 跳 转 指令 中 的 操作 数 类 型 
。 短 跳 转 标识 : 一 个 8 位 的 位 移 值 。 该 标识 所 指定 的 指令 地 址 在 跳 转 指令 本 身 的 带 符号 8 位 
位 移 范 围 内 。 
。 近 跳 转 标识 : 一 个 16 位 的 位 移 值 。 该 标识 所 指定 的 指令 地 址 在 当前 代码 段 范围 内 。 
。16 位 存储 器 指针 (Memptr16) 或 16 位 寄存 器 指针 (Regptr16); 一 个 存储 在 存储 器 或 寄 
存 器 中 的 16 位 偏 移 值 。 存 储 在 存储 器 或 寄存 器 中 的 该 值 被 拷贝 到 IP 寄 存 器 并 形成 从 存储 
器 中 待 取 的 下 一 条 指令 的 偏 移 部 分 。CS 寄 存 器 中 的 值 不 被 改变 ， 所 以 这 种 类 型 的 操作 
数 只 能 引起 当前 代码 段 范围 内 的 跳 转 。 
“ 远 跳 转 标识 或 32 位 存储 器 指针 (Memptr32); 跳 转 操作 数 的 地 址 是 一 个 32 位 的 立即 数 。 
第 一 个 16 位 被 载 入 IP 寄 存 器 的 偏 移 部 分 ， 第 二 个 16 位 被 载 入 CS 寄存 器 。 操 作 数 
Memptr32 也 可 能 被 用 来 指定 一 个 双 字 长 度 的 间接 跳 转 。 也 就 是 说 ， 由 Memptr32 指 定 的 
两 个 连续 的 16 位 存储 地 址 包含 跳 转 指令 的 IP 值 和 CS 值 。 而 且 ， 特 定 的 寄存 器 对 (例如 
DS 和 DX) 可 能 配对 来 指定 跳 转 的 CS 值 和 IP 值 。 
尔 需 要 使 用 的 跳 转 指 令 类 型 通常 由 汇编 器 来 处 理 ， 除 非 你 用 汇编 指令 强制 改变 了 默认 值 。 
在 这 一 章 的 后 面 我 们 会 详细 讨论 这 个 问题 。 


10.15 8086 体 系 结构 的 汇编 语言 程序 设计 


前 面 几 章 所 阐述 的 汇编 语言 程序 设计 原理 与 68K 系 列 中 的 没有 什么 区 别 。 然 而 ， 尽 管 原 理 
可 能 一 样 ， 但 实现 方法 却 有 些 区 别 ， 因 为 : 

1. 8086 与 PC 的 体系 结构 和 操作 系统 有 密切 的 关系 ， 

2. 分 段 的 存储 器 体系 结构 要 求 我 们 声明 所 写 程 序 的 类 型 ， 并 指定 汇编 器 将 要 生成 的 操作 
码 的 存储 模型 (memory model) 。 

为 了 针对 8086 处 理 器 编写 可 以 在 PC 机 上 自由 运行 的 可 执行 汇编 语言 程序 ， 你 至 少 要 遵循 
MS-DOS 的 规则 。 这 就 要 求 你 不 能 预 设 代码 段 寄 存 器 的 值 ， 因 为 在 操作 系统 将 程序 装 和 人 存储 器 
的 时 候 它 会 初始 化 这 个 寄存 器 。 因 此 ， 当 我 们 想 要 在 68K 环 境 下 编写 可 重 定位 的 代码 时 ， 我 们 
应 当 使 用 PC 或 地 址 寄存 器 相对 寻 址 模式 。 这 里 ， 我 们 允许 操作 系统 指定 CS 寄存 器 的 初始 值 。 

像 Borland 的 Turbo 汇 编 器 (TASM) 和 微软 的 MASM 之 类 的 汇编 器 能 为 你 处 理 许多 常规 事 
情 。 因 此 ， 只 要 遵循 规则 ， 你 仍 可 以 写 出 运行 良好 的 汇编 语言 程序 。 当 然 ， 这 些 程序 可 以 在 
任何 仍然 运行 16 位 兼容 PC 操作 系统 的 机 器 上 运行 。 较 新 的 32 位 版 本 则 有 更 多 的 问题 ， 因 为 在 
仿真 模式 下 运行 老 版 本 的 DOS 程 序 可 能 识别 不 出 老 版 本 的 BIOS 调 用 。 但 是 ， 大 多 数 进行 简单 
VO 控制 的 汇编 语言 程序 都 可 以 在 DOS 窗 口中 顺畅 运行 。 作 为 一 个 不 信任 科技 发 展 的 人 ， 我 仍 
然 拥 有 自己 信任 的 运行 着 老 版 本 MS-DOS 的 486 机 器 ， 尽 管 我 现在 是 在 运行 着 Windows XP 的 
系统 中 写 这 本 书 的 。 

让 我 们 首先 来 看 看 段 指 令 和 存储 模型 问题 。 通 常 ， 有 必要 明显 地 指定 程序 中 处 理 代 码 、 
数据 和 栈 的 部 分 。 这 与 你 已 经 看 到 的 相 类 似 。 我 们 使 用 指令 : 


* .code 
»* .Stack 
。 .data 


来 指示 代码 中 这 些 段 的 位 置 (注意 这 些 命令 都 以 一 个 句点 开头 )。 例 如 ， 如 果 使 用 命令 : 


.Stack 100h 


ke 
oo 
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你 就 为 这 个 程序 保留 了 256 个 字 节 的 栈 空间 。 没 有 必要 指定 堆栈 本 身 应 该 在 哪里 ， 因 为 操作 系 
统 会 替 你 管理 ， 而 且 当 载 入 这 个 程序 时 操作 系统 已 经 启动 并 运行 了 。 
.aata 命 令 指 明 程序 的 数据 空间 。 例 如 ， 你 的 程序 中 可 能 有 下 面 这 些 变量 ; 


data 
varlé6 dw OAAAAD 
var8 ab 55h 
initMsg apb ‘Hello World’, 0Ah, ODh 


该 数据 空间 声明 了 三 个 变量 var16、var8 和 initMsg 并 初始 化 了 它们 。 为 了 能 够 在 程序 中 使 用 该 
数据 空间 ， 需 要 将 DS 段 寄存 器 初始 化 为 数据 段 的 地 址 。 但 是 ， 由 于 你 不 知道 地 址 在 哪 ， 你 需 
要 间接 指定 : 


MOV AX,@data 7 数据 段 的 地 址 
MOV DS,AX 


这 里 ，@data 是 使 得 汇编 器 计算 正确 的 DS 段 值 的 保留 字 。 

.code 命 令 指明 了 代码 段 的 开始 位 置 。 当 程序 被 装 入 存储 器 的 时 候 ，CS 寄 存 器 将 被 初始 
化 为 指向 该 段 的 起 始 位 置 。 

除了 指明 各 种 程序 段 驻 留 在 存储 器 中 的 什么 地 方 之 外 ， 你 还 得 给 汇编 器 和 操作 系统 提供 
所 要 求 的 寻 址 类 型 的 选择 以 及 程序 所 需要 的 存储 资源 量 ， 这 些 可 以 用 .model 命 令 完 成 。 就 像 
我 们 所 看 到 的 执行 段 内 跳 转 和 有 段 间 跳 转 时 需要 不 同 指针 类 型 一 样 ， 模 型 的 指定 说 明了 程序 的 
大 小 和 数据 空间 要 求 。 有 效 的 存储 模型 是 ? 

。 微 模型 (tiny); 程序 代码 和 数据 都 在 相同 的 64K 的 段 中 ， 而 且 ， 代 码 和 数据 都 被 定义 为 

near， 这 意味 着 它们 是 通过 重 载 IP 寄 存 器 来 进行 转移 的 。 

。 小 模型 (small) : 程序 中 的 代码 都 在 一 个 大 小 为 64K 的 段 中 ， 而 数据 则 都 在 一 个 单独 的 

64K 段 中 。 代 码 和 数据 都 是 near。 

。 中 模型 (medium); 程序 中 的 代码 可 能 大 于 64K， 但 是 程序 数据 的 大 小 必须 足够 小 以 适 

应 单个 64K 的 段 。 代 码 定 义 为 far， 意 味 着 段 和 偏 移 都 必须 指定 ， 而 数据 访问 则 是 near。 

。 紧凑 模 型 (compact): 程序 中 的 代码 都 在 一 个 64K 段 中 ， 但 数据 的 大 小 可 能 超过 64K， 

没有 像 数组 之 类 的 大 于 64K 的 单个 数据 元 素 。 代 码 访问 是 near， 数 据 访 问 是 far。 

。 大 模型 (large) : 代码 和 数据 空间 都 可 能 大 于 64K。 但 是 没有 单个 数据 数组 大 于 64K。 

所 有 的 数据 和 代码 访问 都 是 far。 

。 巨 模型 (huge): 代码 和 数据 空间 都 可 能 大 于 64K， 而 且 数 据 数组 也 可 能 大 于 64K。 所 

有 的 数据 、 代 码 和 数组 指针 都 是 far。 

存储 模型 的 使 用 是 非常 重要 的 ， 因 为 它们 与 PC 中 编译 器 使 用 的 存储 模型 一 致 。 它 保证 了 
将 要 编译 链接 的 汇编 语言 模块 与 用 高 级 语言 编写 的 模块 相互 兼容 。 

让 我 们 来 查看 一 个 可 以 在 你 的 PC 机 DOS 念 真 窗口 中 运行 的 程序 。 


»- MODEL small 
.STACK 100h 

.DATA 

Prnstrg db ‘Hello Worlds$’ ;将 要 输出 的 字符 串 
.CODE 

Start: 
mov ax@data ;设置 数据 自 
mov de,ax ;初始 化 数据 段 寄存 器 
mov x, OFFSET Prnstrg ;将 数据 的 偏 移 值 装 入 dx 
mov ah,09 ;输出 字符 串 的 DOS 调 用 
int 21h ;DOS 调 用 输出 字符 串 
mov ah, 4Ch ;准备 退出 
int 21h ;退出 并 返回 到 DOS 


END Start 
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也 许 你 已 经 狂 到 了 ， 这 个 程序 代表 的 只 是 8086 汇 编 语 言 程序 设计 的 最 初级 步骤 。 回 忆 一 
下 第 一 个 你 真正 编译 和 运行 的 C++ 程序 ， 你 可 能 感动 得 眼睛 都 湿润 了 。 

我 们 正在 使 用 的 是 “小 ”(small) 存储 模型 ， 尽 管 “ 微 ”(tiny) 模型 也 可 以 运行 良好 。 
我 们 已 经 为 栈 空间 保留 了 256 个 字 节 ， 但 很 难说 我 们 已 经 使 用 了 所 有 的 栈 空间 ， 因 为 我 们 没有 
调用 任何 子 过 程 。 

.data 命 令 定义 了 数据 空间 ， 而 且 我 们 定义 了 一 个 字 节 字符 串 “Hello World$”。 符 号 $ 用 来 
告诉 DOS 停 止 字符 串 输出 。Borland 建议 指令 标号 本 身 应 该 独占 一 行 ， 因 为 这 样 更 容易 识别 一 
个 标号 ， 而 且 当 一 个 指令 需要 添加 到 标号 后 面 时 ， 这 样 更 容易 实现 。 但 是 ， 标 号 可 能 与 它 涉及 
的 指令 在 同一 行 , 涉及 指令 的 标号 必须 以 一 个 冒号 结束 , 而 涉及 数据 对 象 的 标号 则 不 需要 冒号 。 
当 标号 是 一 个 程序 中 的 目标 时 ， 例 如 循环 指令 或 跳 转 指 令 中 的 标号 ， 也 不 需要 使 用 冒号 。 

保留 字 offset 用 来 指示 汇编 器 计算 从 指令 到 标号 “PrnStrg” 的 偏 移 ， 并 将 该 值 在 入 DX 寄 
存 器 。 这 完善 了 用 来 完整 指示 将 要 输出 的 字符 串 数据 的 段 和 偏 移 值 所 必需 的 代码 。 一 且 我 们 
确定 了 字符 串 的 指针 ， 我 们 就 可 以 将 输出 一 个 字符 串 的 DOS 功 能 调用 09 载 人 AH 寄存 器 。 该 调 
用 通过 一 个 软件 中 断 INT 21h 来 实现 ，INT 21h 与 68K 模 拟 器 中 的 指令 TRAP #15 的 功能 相同 。 

程序 通过 一 个 DOS 终 止 调 用 (AH = 4Ch 时 INT 21h) 来 停止 ，END 保 留 字 告 诉 汇 编 器 停 
止 汇编 。 紧 跟着 END 命 令 的 标号 告诉 汇编 器 程序 是 从 哪里 开始 执行 的 。 这 可 能 与 代码 段 的 开 
头 有 区 别 ， 如 果 你 想 要 在 某 个 位 置 而 不 是 代码 段 的 开头 进入 程序 ， 那 么 这 是 非常 有 用 的 。 


10.16 系统 向 量 


与 68K 一 样 ， 最 开始 的 1K 存 储 地 址 是 为 系统 中 断 向 量 和 异常 保留 的 。 在 8086 体 系 结构 中 ， 
中 断 号 是 一 个 0~255 的 8 位 无 符号 数 。 中 断 操作 数 左 移 两 次 〈 乘 以 4) 可 以 得 到 中 断 处 理 程 序 的 
指针 地 址 。 因 此 ，INT 21h 指 令 使 得 处 理 器 通过 存储 地 址 00084bh 能 得 到 操作 系统 入 口 处 4 字 节 
的 段 和 偏 移 。 在 这 个 例子 中 ，IP 偏 移 定位 在 字 地 置 00084h， 而 CS 指针 则 定位 在 字 地 址 00086h。 
AH 寄存 器 中 的 功能 代码 09 能 让 DOS 打 印 DS:DX 所 指向 的 字符 串 。 


10.17 系统 启动 


一 个 基于 8086 的 系统 重启 (RESET) 时 ， 除 了 CS 寄存 器 被 设置 为 OFFFFh 之 外 ， 所 有 的 寄 
存 器 都 被 设置 为 9， 所 以 第 一 个 取 指 令 的 物理 地 址 是 OFFFFh:0000 或 者 OFFFFO0h ， 这 是 离 物理 
存储 器 顶部 16 个 字 节 处 的 地 址 。 因 此 ，8086 系 统 通常 在 存储 器 高 处 有 非 易 失 性 存储 器 ， 以 便 
在 系统 重启 时 装载 引导 代码 。 一 旦 重启 后 ， 这 16 个 字 节 也 足以 用 来 执行 少量 代码 ， 包 括 跳 转 
到 实际 进行 初始 化 的 代码 的 开头 。 一 旦 进入 了 ROM 代 码 的 开始 处 ， 系 统 就 会 通过 将 值 写 入 
RAM 中 来 初始 化 存储 器 低 处 的 中 断 向 量 ， 而 这 些 值 也 就 占据 了 地 址 空间 的 存储 器 低 端 部 分 。 


总 结 


[TRAE] 


这 一 章 马上 就 要 结束 了 ， 你 可 能 非常 高 兴 也 可 能 会 失望 。 毕 竟 我 们 仔细 研究 了 68K 的 指令 
集 ， 也 学 习 了 很 多 汇编 语言 程序 的 例子 。 在 这 一 章 中， 我们 接触 了 很 多 的 代码 片段 ， 但 只 有 
一 个 相对 很 小 的 程序 ， 为 什么 呢 ? 

在 这 本 书 的 开始 部 分 我 们 学 习 了 汇编 语言 程序 设计 的 基础 ， 同 时 也 学 习 了 计算 机 的 体系 
结构 。68K 系 列 本 身 的 体系 结构 是 相当 简单 的 ， 这 就 可 以 让 我 们 集中 精力 于 寻 址 和 算法 的 基本 
原理 。8086 体 系 结构 是 比较 难 掌握 的 一 种 体系 结构 ， 所 以 我 们 把 它 的 介绍 一 直 推 迟到 了 这 本 





Ww 


242 种 10 间 








书 的 后 面 。 既 然 你 已 经 学 习 了 汇编 语言 程序 设计 的 一 般 方 法 ， 我 们 就 应 该 把 精力 集中 在 掌握 
8086 体 系 结构 本 身 的 错综复杂 方面 。 无 论 如 何 ， 毕 竟 理 论 上 是 这 样 的 。 

下 一 章 我 们 将 学 习 第 三 种 体系 结构 ， 你 可 能 又 一 次 发 现 它 很 新 鲜 或 很 令 人 诅 丧 。 令 人 诅 
形 的 是 你 不 再 拥有 所 有 在 8086 体 系 结构 中 的 功能 强大 的 指令 模式 和 寻 址 模式 ， 新 鲜 的 是 你 不 
需要 掌握 所 有 功能 强大 而 复杂 的 指令 模式 和 寻 址 模式 。 

本 章 讲述 了 以 下 内 容 : 

。8086 和 8088 微 处 理 器 的 基本 体系 结构 

。8086 的 存储 神 型 和 和 寻 址 模型 

。8086 系 列 的 指令 集体 系 结构 

。8086 汇 编 语言 程序 设计 的 基础 
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习题 


1. 存储 地 址 9C0020h 处 的 内 容 为 0C7h， 且 存储 地 址 0C0021h 处 的 内 容 为 15h。0C0020h 处 存储 
的 字 是 什么 ? 它 是 对 齐 的 还 是 非 对 齐 的 ? 
2. 假设 你 有 一 个 存储 在 存储 器 中 字 节 地 址 0A3004h 到 0A3007h 的 指针 (有 段 : 偏 移 )， 如 下 所 示 : 
<0A3004h> = 00 
<0A3005h> = 10h 
<0A3006h> = 0C3h 
<0A3007h> = 50h 
将 这 个 指针 用 段 : 偏 移 的 形式 表示 。 
. 如 果 段 寄存 器 的 值 是 0A300h， 那 么 物理 存储 地 址 0A257Ch 处 的 偏 移 值 是 什么 ? 
4. 将 下 面 的 汇编 语言 指令 转换 为 与 它们 等 价 的 目标 代码 
MOV AX,DX 
MOV BXI[SI], BX 
MOV DX,0A34h 
5. 写 一 段 实现 下 面 功能 的 简单 代码 : 
a. 将 值 10 载 入 BX 寄存 器 ， 将 值 4 载 和 CX 寄存 器 。 
b. 执行 一 个 循环 ， 使 BX 每 次 增 1 并 递减 CX 直到 <CX> = 00。 
6. 将 值 0OAA55h 载 和 人 AX 寄 存 器 并 交换 寄存 器 中 的 字 节 。 
7. 当 执 行 完 下 面 的 两 个 指令 后 AX 寄 存 器 的 内 容 是 什么 ? 


LO 
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MOV AX,O0AFF6h 

ADD AL,47h 
.假设 你 想 执行 数学 操作 X = Y * Z， 共 中 : 

X 是 偏 移 地 址 200h 处 的 一 个 32 位 无 符号 变量 ， 

Y 是 偏 移 地 址 204h 处 的 一 个 16 位 无 符号 变量 ， 

Z 是 偏 移 地 址 206h 处 的 一 个 16 位 无 符号 变量 ， 

写 一 段 实现 该 操作 的 8086 汇 编 语言 代码 。 
9. 编写 一 段 程序 ， 将 从 地 址 82000h 开 始 的 1000 个 字 节 数据 移 到 地 址 82200h 处 。 
10. 修改 第 9 题 中 的 程序 ， 使 得 程序 将 1000 个 字 节 的 数据 从 82000h 移 到 C4000h。 
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第 11 章 ARM 体系 结构 


学 习 目 标 

。 描 述 ARM 系 列 的 处 理 器 体系 结构 ， 

。 描 述 ARM7 处 理 器 的 基本 指令 集体 系 结构 ， 

。 描 述 ARM 体 系 结构 和 68000 体 系 结构 之 间 的 异同 ; 

。 结合 体系 结构 的 所 有 寻 址 模式 和 指令 ， 编 写 ARM 汇 编 语言 的 简单 程序 。 


11.1 引言 


我 们 将 把 注意 力 从 68K 和 8086 体 系 结构 转移 到 一 个 新 的 方向 。 你 可 能 会 认为 这 次 方向 的 改变 
非常 新 鲜 ， 因 为 我 们 将 要 学 习 的 体系 结构 的 特征 是 : 削减 指令 ， 只 剩 下 最 基本 的 指令 模式 和 寻 
址 模式 。 我 们 称 围绕 该 体系 结构 建立 起 来 的 计算 机 为 RISC 计 算 机 ， 这 里 RISC 是 精简 指令 集 计 算 
机 (Reduced Instruction Set Computer) 的 缩写 。68K 和 8086 处 理 器 是 以 一 种 称 为 复杂 指令 集 计算 
机 (Complex Instruction Set Computer, CISC) 的 体系 结构 为 特征 的 。 我 们 将 在 后 面 的 一 章 比较 这 
两 种 体系 结构 。 目 前 ， 我 们 只 需 往 前 学 习 ARM 体 系 结构 ， 权 当 我 们 没有 了 昕 说 过 CISC 和 RISC。 

1999 年 ，ARM 32 位 体系 结构 最 终 在 受 欢 迎 程度 上 超过 了 Motorola 68K 体 系 结构 '"。68K 体 
系 结构 从 它 被 发 明 开始 就 一 直 统治 着 戏 入 式 系统 世界 ， 但 是 ARM 则 成 了 今天 最 受 欢 迎 的 32 位 
代入 式 处 理 器 。 而 且 ， 今 天 的 ARM 处 理 器 比 Intel 奔 腾 系 列 卖 得 还 多 ， 基 本 上 是 3 : 1 的 比例 *。 
因此 ， 你 应 该 已 经 明白 了 我 们 讲授 这 3 种 微 处 理 器 体系 结构 的 道理 所 在 。 

如 果 你 碰巧 在 得 克 萨 斯 州 奥斯汀 ， 那 么 你 应 该 到 城南 去 访问 一 下 AMD 公 司 的 有 影响 力 的 硅 
片 制 造 厂 FAB 25。 在 这 个 现代 的 价值 几 十 亿美 元 的 工厂 中 ， 硅 圆 片 被 转变 为 Athlon 微 处 理 器 。 
不 远 处 ，Freescale (Motorola) 的 FAB (制造 设备 ) 则 生产 PowerPC 处 理 器 。Intel 则 在 美国 亚 利 
又 那州 钱 德 勒 和 加 州 圣何塞 以 及 世界 其 他 地 方 的 FAB 生 产 它 的 处 理 器 。ARM 的 FAB 在 哪里 呢 ? 
小 心 ， 这 是 一 个 围 套 。 事 实 上 ，ARM 没 有 任何 FAB ， 它 是 一 个 没有 制造 厂 的 微 处 理 器 生产 商 。 

ARM 控 股 公司 (Holdings PLC) 是 在 1990 年 以 Advanced RISC Machines Ltd.3 的 名 字 建 立 
的 ， 它 的 基地 在 英国 ， 是 Acorn 计 算 机 集团 、 鞋 果 公 司 和 VLSI Technology 联 合 投资 建立 的 。 
ARM 自 己 并 不 制造 芯片 ， 它 将 芯片 设计 授权 给 合作 者 们 ， 如 VLSI Technology、Texas 
Instruments、Sharp、GEC Plessey 和 Cirrus Logic， 他 们 将 ARM 处 理 器 融 于 它们 生产 和 销售 的 
定制 器 件 中 。 正 是 ARM 创 建 了 知识 产权 (Intellectual Property, IP) 的 销售 模式 ， 而 不 是 将 硅 
芯片 封装 在 包 中 。 在 这 种 意义 上 说 ， 这 无 异 于 购买 软件 ， 实 际 上 也 确实 是 。 想 要 生产 诸如 
PDA/ 手 机 /照相 机 /MP3 播 放 器 等 娃 上 系统 (system-on-silicon) 的 客户 就 要 与 VLSI Technology 
订 合 同 来 生产 物理 部 件 。 获 ARM 授 权 的 VLSI 公司 提供 给 客户 一 个 用 硬件 描述 语言 (如 Verilog) 
编号 的 加 密 库 。 与 客户 许可 的 其 他 IP 以 及 他 们 自己 设计 的 IP 一 起 ， 就 创建 了 芯片 的 Verilog 描 
述 ，VLSI 公 司 就 可 以 利用 这 个 描述 来 创建 物理 部 件 。 因 此 ， 你 就 可 以 看 到 像 ARM 之 类 公司 的 
出 现 ，Mead 和 Conway 预 言 的 集成 电路 设计 模式 成 为 现实 。 

今天 ，ARM 为 广阔 的 应 用 领域 提供 了 各 种 处 理 器 设计 。 就 像 学 习 68K 和 8086 时 我 们 所 做 
的 一 样 ， 我 们 将 把 精力 集中 在 该 系列 的 大 多 数 产品 中 最 普通 的 基本 32 位 ARM 体 系 结构 。 
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当 我 们 讨论 ARM 处 理 器 时 ， 我 们 经 常用 一 个 术语 “ 核 ”(core) 。 核 是 一 个 微 处 理 器 中 最 基本 
的 部 分 。 当 设计 硅 上 系统 (或 片上 系统 ) 时 ， 一 个 或 多 个 微 处 理 器 核 与 外 围 设备 组 合 在 一 起 可 以 
在 单个 硅 片 上 形成 完整 的 系统 设计 。 简 单 形式 的 SOC 已 经 出 现 一 段 时 间 了 。 我 们 今天 称 这 些 商 业 
上 可 得 到 的 部 件 为 微 控 制 器 (microcontroller) ，Intel 和 Motorola 是 微 控 制 器 制造 的 先驱 。 历 史上 ， 
像 Motorola 之 类 的 半导体 公司 都 会 开发 一 个 新 的 微 处 理 器 (如 68K 系 列 )， 并 将 这 个 新 产品 高 价 卖 
给 专门 的 客户 ， 就 是 那些 一 直 在 做 前 沿 设计 并 愿意 以 高 价 买 到 最 高 性 能 的 最 新 处 理 器 的 客户 。 

随 着 处 理 器 得 到 更 广泛 的 认可 ， 半 导体 公司 改进 了 其 制造 工艺 ， 这 些 公司 常常 移植 CPU 
核 ， 将 其 置 入 拥有 其 他 外 围 器 件 (例如 定时 器 、 存 储 控制 器 、 串 口 和 并 口 ) 的 另 一 个 设备 中 。 
由 于 这 些 设备 有 更 高 的 集成 度 ， 所 以 这 些 部 件 在 注重 节省 成 本 的 应 用 中 变 得 非常 流行 。 然 而 ， 
一 些 客户 只 需要 购买 提供 方 产品 的 一 些 特 别 部 件 。 如 果 客 户 需要 一 个 不 同 的 部 件 ， 他 们 或 者 
购买 他 们 可 以 找到 的 最 相近 的 部 件 并 在 印刷 电路 板 上 增加 额外 的 电路 ， 或 者 与 卖方 合作 为 他 
们 的 产品 设计 一 个 定制 的 微 控 制 器 。 

因此 ， 我 们 所 讨论 的 可 能 是 采用 原始 的 68K 核 如 68302 ( 称 为 CPU16) 的 Motorola 微 控制 
器 ， 也 可 能 采用 全 32 位 68K 核 如 68360 (CPU32) 的 更 先进 的 微 处 理 器 。Intel 的 80186 处 理 器 
采用 8086 核 在 单个 芯片 上 组 建 了 一 个 完整 的 PC，AMD 的 SC520 (Elan) 则 采用 486 核 在 单个 
芯片 上 组 建 了 一 个 完整 的 PC。 最 初 的 PalmPilot 使 用 一 个 Motorola 68328 微 控制 器 (代号 
Dragonball) 作为 它 的 引擎 。 因 此 ， 由 于 所 有 的 ARM 处 理 器 本 身 就 是 〈 要 被 设计 植 人 片上 系 
统 的 ) 核 ， 所 以 我 们 将 继续 使 用 这 个 术语 。 


11.2 ARM 体 系 结构 简介 


图 11-1 是 ARM 核 体系 结构 的 一 个 简化 的 示意 图 。 数 据 和 指令 进入 后 例 行 地 被 送 入 指令 译 码 
器 或 标记 为 r0-r15 的 某 个 通用 目标 寄存 器 。 与 68K 和 8086 处 理 器 中 到 内 存 的 单一 双向 数据 总 线 不 
同 ， 很 多 ARM 都 被 设计 成 单独 的 数据 总 线 和 地 址 总 线 进入 指令 存储 器 (代码 空间 ) 和 数据 存储 
器 。 这 种 带 有 单独 数据 存储 器 和 指令 存储 器 的 设计 叫做 哈佛 体系 结构 (Harvard Architecture)。 

所 有 的 数据 操作 都 发 生 在 寄存 器 
文件 (register file) 中 ， 这 是 一 组 16 位 
或 32 位 宽 的 通用 目标 寄存 器 。 这 与 我 
们 前 面 讨 论 的 专用 地 址 寄存 器 、 数 据 
寄存 器 和 变 址 寄存 器 的 概念 截然 不 同 。 
尽管 一 些 寄存 器 确实 拥有 专门 的 功能 ， 
但 是 另外 一 些 寄 存 器 却 只 可 以 用 作 源 
操作 数 、 目 的 操作 数 或 存储 器 指针 。 
从 存储 器 到 寄存 器 的 8 位 和 16 位 宽 的 数 
据 在 存 到 寄存 器 之 前 被 自动 转换 成 了 
带 符号 扩展 的 32 位 数字 。 这 些 寄存 器 
被 认为 是 正 交 的 (orthogonal) ， 因 为 它 
们 在 地 址 或 数据 存储 方面 可 完全 互 换 。 

所 有 的 算术 操作 和 风 辑 操作 都 发 
生 在 寄存 器 之 间 。 如 下 所 示 的 68K 的 
存储 操作 数 和 寄存 器 混合 加 法 之 类 的 
指令 是 不 允许 的 : 图 11-1 ARM 体 系 结构 
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ADD D5,$10AA  ”* 将 D5 加 入 到 $10AA 并 将 结果 存储 在 $10AA 中 
而 且 ， 大 多 数 算术 和 逻辑 操作 都 涉及 3 个 操作 数 。 因 此 ， 两 个 操作 数 Rn 和 Rm 被 处 理 ， 结 果 Rd 
被 返回 至 目的 寄存 器 。 例 如 ， 指 令 : 


ADD rr7,r1,r0 


将 寄存 器 "0 和 rl 的 32 位 带 符号 数 相 加 并 将 结果 放 入 r7。 通 常 ，3 操 作 数 指令 的 格式 为 ， 
opcode Rd, Rn, Rm 
其 中 Rm 操作 数 在 进入 ALU 之 前 还 要 通过 一 个 桶 式 移 位 器 单元 ， 这 意味 着 在 一 条 汇编 语言 指令 
中 移 位 操作 将 在 Rm 操作 数 上 执行 。 除 了 标准 的 ALU，ARM 体 系 结构 还 包括 一 个 专用 的 乘法 
累加 (multiply-accumulate, MAC) 单元 ， 它 既 可 以 完成 两 个 寄存 器 的 一 次 标准 乘法 操作 ， 又 
可 以 将 结果 与 另 一 个 寄存 器 累加 。 基 于 MAC 的 指令 在 信号 处 理应 用 中 在 是 非常 重要 的 ， 因 为 
MAC 操 作 是 数值 积分 的 基础 。 请 看 图 11-2 所 示 的 数值 积分 的 例子 。 
为 了 计算 曲线 下 面 的 面积 或 b 

者 求解 一 个 积分 方程 ， 我 们 可 以 使 y = / Fogdx 






用 一 种 数值 近似 方法 。 曲 线 下 面积 累加 a 
的 每 一 次 连续 计算 都 涉及 计算 一 个 / 乘法 
小 直角 梯形 的 面积 并 将 这 些 面 积 求 by oN FW 


Y =5 1/2[ F(x) + F(x + Ax) ] Ax 


和 。 每 个 面积 的 计算 都 是 一 次 乘法 x=a 
操作 ， 而 这 些 梯形 面积 的 和 就 是 总 Ax- 引 | x 2° 
和 保持 来 图 11-2 一 个 乘法 -时 加 (MAC) 单元 能 够 加 速 数值 积分 计算 
ARM 处 理 器 使 用 装载 /存储 体系 结构 。 装 载 (load) 是 指数 据 从 存储 器 传输 到 寄存 器 文件 
中 的 一 个 寄存 器 ， 存 储 (store) 是 指数 据 从 寄存 器 文件 传输 到 存储 器 。 装 载 和 存储 指令 使 用 
ALU 计 算 存 储 在 地 址 寄存 器 中 的 地 址 值 以 便 传送 到 地 址 总 线 上 。 递 增 器 用 来 为 后 续 的 装载 或 
存储 操作 增加 地 址 寄存 器 的 值 。 | 
在 任何 时 候 ， 一 个 ARM 处 理 器 可 能 处 于 7 种 操作 模式 之 一 。 最 基本 的 模式 叫做 用 户 模式 
(user mode)， 用 户 模式 在 7 种 模式 中 是 优先 级 最 低 的 。 当 处 理 器 在 用 户 模 式 下 时 它 正 在 执行 
用 户 代码 。 在 这 种 模式 下 有 18 个 活动 的 寄存 器 : 16 个 32 位 的 数据 寄存 器 和 2 个 32 位 宽 的 状态 寄 
存 器 。 在 16 个 数据 寄存 器 中 ，r13、r14、r15 被 分 配 了 特别 的 任务 。 
。r13; 栈 指 针 。 这 个 寄存 器 指向 当前 操作 模式 下 的 栈 顶 。 在 特定 的 情况 下 ， 这 个 寄存 器 
也 可 能 被 用 作 另 一 个 通用 寄存 器 ， 然 而 ， 当 运行 在 一 个 操作 系统 下 时 这 个 寄存 器 经 常 
被 指定 为 指向 一 个 有 效 的 堆栈 帧 。 
"。 r14: 连接 寄存 器 。 当 处 理 器 执行 一 个 子 程序 分 支 时 保存 返回 地 址 。 在 特定 情况 下 ， 这 
个 寄存 器 也 可 能 被 用 作 一 个 通用 寄存 器 。 
。Tr15: 程序 计数 器 : 保存 将 要 从 存储 器 中 获取 的 下 一 条 指令 的 地 址 。 
在 用 户 模式 下 进行 操作 时 ， 当 前 程序 状态 寄存 器 (current program status register, cpsr) 
的 功能 是 作为 标准 的 程序 标志 和 处 理 器 标志 的 仓库 。cpsr 也 是 寄存 器 文件 的 一 部 分 并 且 也 是 32 
位 宽 的 (尽管 在 基本 的 ARM 体 系 结构 中 有 很 多 位 没有 使 用 )。 
实际 上 有 两 个 程序 状态 寄存 器 。 第 二 个 程序 状态 寄存 器 叫做 程序 状态 保存 穿 存 器 (saved 
program status register, spsr)， 当 发 生 模 式 改 变 时 ， 它 被 用 来 存储 cpsr 的 状态 。 因 此 ， 当 发 生 
上 下 文 切 换 时 ，ARM 体 系 结 构 将 状态 寄存 器 保存 在 一 个 特定 的 地 方 而 不 是 压 人 栈 中 。 程 序 状 
态 寄存 器 如 图 11-3 所 示 。 
程序 状态 寄存 器 分 为 4 个 域 : 标志 、 状 态 、 扩 展 和 控制 。 在 基本 的 ARM 体 系 结构 中 ， 没 有 用 
到 状态 和 扩展 域 ， 它 们 是 为 以 后 的 扩展 所 保留 的 。 标 志 域 包含 4 个 状态 标志 : 


ARM 体 夭 结 构 247 


标志 状态 扩展 控制 





31 30 29 28 27 


a ee 处 理 器 模式 
THUMB 


图 11-3 状态 寄存 器 配置 


。N 位 : 负 标 志 。 当 结果 的 第 31 位 为 负数 时 置 位 。 

。Z 位 : 零 标志 。 当 结果 为 0 或 相等 时 置 位 。 

。C 位 : 进位 标志 。 当 结果 产生 无 符号 进位 时 置 位 。 

。V 位 : 溢出 标志 。 当 结果 产生 符号 溢出 时 置 位 。 

中 断 掩 码 位 用 来 使 能 或 屏蔽 到 处 理 器 的 两 种 类 型 的 中 断 请 求 。 当 中 断 掩 码 位 为 使 能 时 ， 
处 理 器 可 以 接收 正常 的 中 断 请 求 (IRQ) 或 快速 中 断 请 求 (FIQ)。 当 其 中 一 位 被 设置 为 1 时 ， 
相应 类 型 的 中 断 就 会 被 屏蔽 ， 或 者 说 是 阻止 中 断 源 停止 处 理 器 当前 执行 线程 并 为 中 断 服务 。 

Thumb 模 式 位 则 与 你 手头 的 工作 没有 联系 。 它 是 一 种 特殊 的 模式 ， 是 为 了 通过 将 初始 的 
32 位 ARM 指 令 集 压缩 成 16 位 形式 从 而 提高 ARM 的 代码 密度 而 设计 的 ， 因 此 在 程序 存储 空间 需 
求 上 可 以 减少 到 一 半 。 特 别 的 片上 硬件 即时 地 将 Thumb 指 令 解压 缩 回 标准 的 32 位 宽 指令 。 然 
而 ， 世 上 没有 免费 的 午餐 ， 使 用 Thumb 模 式 也 有 一 些 固有 的 局 限 。 例 如 ， 当 处 理 器 处 于 
Thumb 模 式 时 ， 只 有 通用 目标 寄存 器 r0 到 r7 可 以 使 用 。 

位 0 到 位 4 定义 了 当前 处 理 器 的 操作 模式 。 ARM 处 理 器 可 能 处 于 下 表 所 定义 的 7 种 模式 之 一 ， 





模 式 缩写 特权 模式 位 [4:0] 
异常 中 止 abt 是 LO 
快速 中 断 请 求 fiq 是 10001 
中 断 请 求 irq 是 10010 
管理 SVC 是 10011 
系统 sys 是 | 
未 定义 und 是 11011 
用 户 UST 否 10000 





用 户 模式 的 优先 级 最 低 ， 这 意味 着 它 不 
能 修改 处 理 器 状态 寄存 器 的 内 容 , 换 句 话说 ， 
它 不 能 使 能 或 屏蔽 中 断 、 进 入 Thumb 模 式 或 
修改 处 理 器 的 操作 模式 。 在 逐个 讨论 这 些 模 
式 前 ， 我 们 需要 先 弄 明白 每 种 模式 是 怎样 使 
用 寄存 器 文件 的 。 基 本 的 ARM 体 系 结构 中 
一 共有 37 个 寄存 器 ， 我 们 讨论 了 在 用 户 模式 
下 能 够 访问 的 18 个 寄存 器 。 当 其 他 操作 模式 
活动 时 ， 剩 下 的 19 个 寄存 器 就 会 产生 相应 的 
作用 。 图 11-4 显 示 了 每 个 处 理 器 操作 模式 的 
寄存 器 配置 。 

当 处 理 器 运行 在 用 户 模式 或 系统 模式 下 
时 ，13 个 通用 寄存 器 、sp、lr、pc 和 cpsr 是 图 11-4 寄存 器 文件 结构 














248 萝 17 间 











活动 的 。 如 果 处 理 器 进入 快速 中 断 请 求 模式 ， 标 记 为 r8_fiq 到 r14_fiq 的 寄存 器 会 自动 与 相应 的 
299| 寄存 器 r8 到 r14 进 行 交换 。 当 前 程序 状态 寄存 器 (cspr) 的 内 容 也 自动 转移 到 程序 状态 保存 寄 
存 器 (spsr) 。 
因此 ， 当 一 个 快速 中 断 请 求 到 达 处 理 器 ， 而 且 CPSR 中 的 FIQ 掩 码 被 置 有 效 时 ， 处 理 器 能 
够 快速 自动 地 建立 一 组 新 的 可 以 使 用 的 寄存 器 来 服务 这 个 快速 中 断 请 求 。 而 且 ， 由 于 当中 断 
请 求 被 服务 时 cpsr 的 内 容 需 要 用 来 存储 用 户 程序 的 上 下 文 ， 所 以 cpsr 被 自动 保存 到 了 spsr_fiq。 
除了 用 户 和 系统 模式 ， 只 要 其 他 模式 处 于 活动 状态 ，spsr 寄 存 器 都 自动 保存 cpsr 的 内 容 。 
无 论处 理 器 在 何 时 改变 模式 ， 它 都 必须 能 够 最 终 返回 至 以 前 的 模式 并 且 从 它 离 开 的 确切 
位 置 重新 开始 。 因 此 ， 当 处 理 器 进入 一 种 新 模式 时 ， 新 寄存 器 既 指 向 r13_xxx 中 新 模式 的 存储 
栈 ， 也 指向 r14_xxx 中 前 一 种 模式 的 返回 地 址 。 总 之 ， 当 处 理 器 转换 模式 时 ， 新 的 上 下 文 自动 
建立 而 老 的 上 下 文 则 自动 保存 。 当 然 ， 我 们 也 可 以 在 软件 中 完成 这 个 任务 ， 但 是 对 于 实时 应 
用 ,使 用 这 些 额外 的 硬件 资源 可 以 获得 更 好 的 处 理 器 性 能 。 
由 于 使 用 的 寄存 器 都 是 成 组 进行 交换 的 〈 称 为 存储 体 切 换 (bank switch) ) ， 它 们 的 内 容 
可 能 被 预先 装载 了 服务 快速 中 断 请 求 所 需要 的 适当 值 。 而 且 ， 由 于 FIQ 横 式 是 一 个 更 高 优先 级 
的 模式 ， 所 以 当中 断 完毕 时 ， 用 于 服务 快速 中 断 请 求 的 程序 代码 也 能 将 操作 模式 修改 回 用 户 
模式 或 系统 模式 。 我 们 将 在 后 面 一 章 更 详细 地 讨论 中 断 和 中 断 服务 的 一 般 概念 。 
其 他 的 处 理 器 模式 中断 请 求 、 管 理 、 未 定义 和 异常 中 止 都 与 快速 中 断 模式 的 运行 大 体 
相同 。 当 进入 一 个 新 模式 时 ， 该 模式 相应 的 寄存 器 会 与 用 户 模式 下 的 寄存 器 进行 存储 体 切换 。 
基 寄 存 器 的 当前 内 容 不 被 修改 ， 以 便当 用 户 模式 被 恢复 时 ， 旧 的 工作 寄存 器 用 存储 体 切换 发 
生 之 前 的 值 再 次 激活 。 
我 们 剩 下 的 最 后 任务 是 学 习 这 7 种 处 理 器 模式 。 
。 用 户 模式 这 是 通常 的 程序 执行 模式 。 处 理 器 按 常规 使 用 寄存 器 r0 到 r12， 而 且 cpsr 的 标 
志 位 是 根据 能 够 修改 标志 的 汇编 语言 指令 的 执行 结果 来 进行 相应 修改 的 。 
系统 模式 ， 系统 模式 是 具有 更 高 优先 级 的 用 户 模式 ， 这 意味 着 在 系统 模式 下 处 理 器 可 
[300] 以 修改 cpsr 的 值 。 你 可 能 回想 起 68K 也 有 一 种 用 户 和 管理 模式 ， 该 模式 下 可 以 访问 修改 
状态 寄存 器 位 的 附加 指令 。 当 你 的 程序 还 没有 复杂 到 需要 操作 系统 的 加 入 时 ， 系 统 模 
趟 是 可 以 用 来 使 用 的 恰当 模式 。 对 于 更 简单 的 应 用 ， 对 处 理 器 模式 的 访问 将 会 是 一 个 
优势 ， 所 以 系统 模式 将 是 一 个 显而易见 的 选择 。 
快速 中 断 请 求 模 式 : FIQ 和 IRQ 模 式 是 为 处 理 处 理 器 中 断 而 设计 的 。 快 速 中 断 请 求 模式 
提供 的 成 组 寄存 器 比 标准 中 断 请 求 模式 的 多 ， 这 样 在 中 断 服务 进行 过 程 中 需要 保存 额 
外 的 寄存 器 时 ， 处 理 器 的 开销 就 比较 小 。 而 且 ， 对 于 创建 一 个 直接 存储 器 访问 (DMA) 
控制 器 的 软件 模拟 来 说 ，FIQ 模 式 中 使 用 的 7 个 成 组 寄存 器 已 经 足够 了 。 
中 断 请 求 模式 ， 像 FIQ 模 式 一 样 ，IRQ 模 式 是 为 服务 处 理 器 中 断 而 设计 的 。 当 处 理 器 确 
认 中 断 并 将 上 下 文 转向 中 断 服务 程序 时 ， 有 两 组 成 组 寄存 器 可 用 。 
管理 模式 ， 管理 模式 是 为 了 与 操作 系统 内 核 一 起 使 用 而 设计 的 。 在 管理 模式 下 时 ， 所 
有 的 CPU 资源 都 可 用 。 当 处 理 器 第 一 次 重启 后 ， 管 理 模式 是 活跃 模式 。 
未 定义 模式 ， 这 个 模式 是 为 非法 指令 或 目前 使 用 的 ARM 体 系 结构 版 本 不 支持 的 指令 而 
保留 的 。 
异常 中 止 模式 ; 在 特定 情况 下 ， 处 理 器 可 能 会 试图 进行 非法 的 存储 器 访问 。 异 常 中 止 
模式 是 为 处 理 访问 受 限 存储 操作 而 保留 的 。 例 如 ， 特 定 的 硬件 被 设计 用 来 探测 对 只 读 
存储 器 进行 写 操作 的 非法 意图 。 
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11.3 条 件 执行 


ARM 体 系 结构 提供 了 一 个 我 们 以 前 疫 有 考虑 的 相当 独特 的 特征 ， 即 基于 条 件 标志 的 状态 
或 状态 的 逻辑 组 合 来 条 件 执行 大 多 数 指令 的 能 力 。 条 件 代 码 以 及 它们 的 逻辑 定义 如 下 表 所 示 : 





代码 描 述 标志 操作 码 [31:28] 
EQ 等 于 0 Z=1 0000 
NE 不 等 于 0 Z=0 0001 
CS HS 进位 置 位 /无 符号 高 于 或 相等 C=1 0010 
CCLO 进位 清 零 /无 符号 低 于 C=0 0011 
MI 负数 或 减 N=1 0100 
PL 正 数 或 加 N=0 0101 
VS 溢出 置 位 V=1 0110 
VC 洲 出 清 零 V=0 0111 
HI 无 符号 高 于 Z*C 1000 
LS 无 符号 低 于 或 相等 Z+C 1001 
GE 带 符号 大 于 或 等 于 (N*V)+(N*V) 1010 
LT 带 符号 小 于 N xorV 1011 
GT 带 符号 大 于 (N*Z*V)+(N*Z*V) 1100 
LE 带 符 号 小 于 或 等 于 Z + (N xor V) 1101 
AL 总 是 (无条件) 未 使 用 1110 
NV 从 不 (无条件) 未 使 用 1111 


条 件 代 码 可 以 加 到 指令 助 记 符 的 后 面 以 使 指令 根据 标志 的 当前 状态 执行 。 例 如 : 
SUB r3,r1i0,r5 
从 r10 寄 存 器 减 去 5 寄存 器 的 内 容 并 将 结果 放 入 寄存 器 r3 中 。 将 指令 写 为 : 
SUBNE Ir3,r10,r5 
则 只 有 在 零 标志 = 0 时 才 执 行 减法 操作 。 
因此 ， 不 需 插 入 专门 的 转移 或 跳 转 指令 ， 指 令 的 条 件 执行 就 可 以 实现 。 由 于 很 多 汇编 语 
言 的 结构 都 涉及 跳 转 到 下 一 条 指令 ， 条 件 执行 机 制 的 添加 极 大 地 提高 了 指令 集 的 代码 密度 。 
ARM 体 系 结构 的 另 一 个 独特 的 特征 是 ， 它 被 认为 是 数据 处 理 指令 这 一 类 的 指令 ， 包 括 移 
动 指令 、 算 术 和 逻辑 指令 、 比 较 指 令 和 乘法 指令 ， 并 不 自动 改变 条 件 代 码 标志 的 状态 。 就 像 
前 面 那个 例子 可 以 选择 基于 条 件 代 码 标志 的 状态 来 条 件 执行 一 条 代码 一 样 ， 我 们 也 可 以 控制 
一 条 数据 处 理 指令 的 结果 是 否 改变 相应 标志 的 状态 。 例 如 ; 


SUB r3,r10,r5 





执行 减法 操作 但 不 改变 标志 的 状态 。 
SUBS |. r3,r10,r5 
执行 相同 的 减法 操作 ， 但 是 改变 标志 的 状态 。 
SUBNES r3,r1i0,r5 
条 件 执行 相同 的 操作 并 改变 标志 的 状态 。 条 件 执行 标志 “NE” 先 出 现 ， 紧 跟着 的 是 条 件 标志 
更 新 符号 “S”。 因 此 : 
SUBNES r3,r10,r5 
是 一 条 合法 指令 ,但 是 
SUBSNE r3,r10,r5 


是 非法 的 并 会 产生 一 个 未 知 指令 错误 (unknown opcode error)。 
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11.4 桶 式 移 位 器 


从 图 11-1 我 们 看 到 Rm 操 作 数 在 进入 ALU 之 前 通过 了 一 个 桶 式 移 位 器 硬件 块 ， 因 此 ， 我 
们 可 以 在 一 条 指令 中 既 执行 算术 操作 又 执行 移 位 操作 。 桶 式 移 位 器 能 将 32 位 Rm 操 作 数 在 其 
进入 ALU 之 前 移动 任意 位 数 (最 多 32 位 ， 左 移 或 右 移 ) 。 移 位 完全 是 一 次 异步 操作 ， 所 以 不 
302| 需要 额外 的 时 钟 周期 。 我 们 将 把 设计 一 个 能 够 移动 任意 位 数 的 移 位 器 的 门 电路 实现 留 作 一 个 
练习 。 
例如 ，MOV 指 令 用 于 寄存 器 和 寄存 器 之 间 的 数据 传输 和 给 寄存 器 装载 立即 数 。 考 虑 下 面 
的 指令 : 
MOV r6,r1 ; 拷贝 1 到 zx6 
现在 ， 考 虑 增加 了 逻辑 左 移 操 作 的 相同 指令 : 


MOV ré6,rl, LSL #3 ; 拷贝 rl1*8 到 r6 


在 第 二 个 例子 中 ， 寄 存 器 rl 的 内 容 左 移 3 位 ( 乘 以 8) 后 才 拷 贝 到 寄存 器 r6。 移 动 的 位 数 被 
指定 为 一 个 立即 数 或 者 一 个 寄存 器 的 值 。 下 面 的 代码 段 执行 了 与 前 面 例子 相同 的 移 位 和 装载 
操作 : 


MOV r9,#3 ; 初始 化 r9 
MOV r6,rl，LSL r9 ; 拷贝 LI*8 到 =6 


下 面 的 表格 总 结 了 桶 式 移 位 器 的 操作 : 








助 记 符 操 作 移 位 量 

LSL 逻辑 左 移 #0-31 或 寄存 器 
LSR 逻辑 右 移 #1-32 或 寄存 器 
ASR 算术 右 移 #1-32 或 寄存 器 
ROR 循环 右 移 #1-32 或 寄存 器 

RRX 扩展 的 循环 右 移 33 

循环 右 扩 展 有 效 地 将 所 有 位 右 移 1 位 并 将 位 31 拷 贝 到 进位 标志 位 置 。 注 意 标 志 位 是 根据 S 

位 的 状态 来 按 条 件 更 新 的 。 


11.5 操作 数 大 小 


ARM 体 系 结构 允许 对 字 节 (8 位 )、 半 字 (16 位 ) 和 字 (32 位 ) 进行 操作 。 这 一 次 你 又 可 
以 看 到 一 组 稍微 不 同 的 定义 。 然 而 ， 作 为 三 种 体系 结构 中 最 新 的 一 种 ，ARM 的 定义 可 能 是 最 
自然 的 ， 且 更 符合 C 语 言 标准 。 

字 节 可 以 在 任意 边界 寻 址 ， 而 半 字 必须 在 偶 地 址 边界 对 齐 (A0 = 0) ， 字 必须 在 4 字 节 边 
界 对 齐 (A0 和 A1= 0)。 这 比 68K 体 系 结构 甚至 更 严格 ,但 这 是 可 以 理解 的 ， 因 为 大 多 数 ARM 
实现 都 会 有 一 条 到 内 存 的 完全 的 32 位 宽 的 数据 通路 。 因 此 ， 从 A0 = 0 和 Al = 1 的 任意 地 址 获取 
一 个 32 位 宽 的 存储 值 需要 两 次 访问 操作 ， 或 者 一 次 等 价 的 非 对 齐 访问 。 

通过 对 内 核 的 正确 配置 ,ARM 体系 结构 支持 高 端 字 节 序 和 低 端 字 节 序 两 种 数据 存放 方式 。 
然而 ， 该 体系 结构 以 低 端 字 节 序 作为 其 默认 模式 。 载 入 和 存储 数据 的 指令 可 以 通过 附加 操作 
数 类 型 和 大 小 来 可 选择 地 进行 修改 。 下 面 的 表格 列举 了 ARM 体 系 结构 中 的 载 人 /存储 操作 的 

Bo3] 类 型 ， 
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助 记 符 描 述 操 作 





LDR 从 存储 器 中 载 入 一 个 字 到 寄存 器 中 寄存 器 < 32 位 存储 器 

STR 将 一 个 寄存 器 中 的 字 内 容 存 人 存储 器 32 位 存储 器 < 寄存 器 

LDRB 从 存储 器 中 载 人 一 个 字 节 到 寄存 器 中 寄存 器 < 8 位 存储 器 

STRB 将 一 个 寄存 器 中 的 字 节 内 容 存 人 存储 器 8 位 存储 器 < 寄存 器 

LDRH 从 存储 器 中 载 人 半 字 到 寄存 器 中 寄存 器 < 16 位 存储 器 

STRH 将 一 个 寄存 器 中 的 半 字 内 容 存 人 存储 器 16 位 存储 器 < 寄存 器 

LDRSB 载 入 一 个 带 符 号 字 节 到 寄存 器 中 寄存 器 < 符号 扩展 的 8 位 存储 器 

LDRSH 载 入 一 个 带 符号 半 字 到 一 个 寄存 器 中 寄存 器 < 符号 扩展 的 16 位 存储 器 
11.6 寻 址 模式 


对 ARM 体 系 结构 中 可 用 寻 址 模式 的 讨论 比 我 们 以 前 学 习 的 8086 或 68K 体 系 结构 更 加 严格 
一 些 。 原 因 在 于 寻 址 外 部 存储 器 的 寻 址 模式 局 限于 寄存 器 文件 和 存储 器 间 的 数据 传输 操作 。 
在 寄存 器 之 间 使 用 数据 处 理 指令 有 两 种 可 用 的 寻 址 模式 ， 寄存 器 寻 址 和 立即 数 寻 址 。 


SUB r3,r2,r1 ? r3 < r2-r1l 
SUB r7,r7,#1 ; r7 递 减 


上 面 的 例子 中 7 也 是 减法 操作 的 目的 寄存 器 。 通 过 将 r7 减 1 并 将 结果 存 回 r7， 我 们 有 效 地 
执行 了 一 条 递减 指令 。 

这 看 起 来 可 能 非常 奇怪 ,但 是 并 不 是 0 到 2” 一 1 之 间 的 每 一 个 立即 数 都 可 以 指定 。 原 因 在 
于 32 位 指令 的 立即 数 域 只 有 12 位 长 ， 而 且 ， 这 12 位 域 进一步 又 分 为 一 个 8 位 常数 操作 数 和 一 个 
4 位 移 位 域 。 如 图 11-5 所 示 。 

32 位 立即 值 是 通过 将 8 位 立即 值 循环 右 ”11 8 7 0 
移 一 些 偶数 位 来 创建 的 ， 所 以 在 位 域 11:8 为 4 位 循环 
0001 的 值 将 使 得 8 位 立即 值 循环 右 移 2 位 。 因 四 
此 ， 所 有 有 效 的 立即 操作 数 将 由 最 多 有 8 个 图 11-5 定义 一 个 立即 操作 数 的 指令 的 0~11 位 
相 邻 二 进 制 1 的 位 于 偶数 边界 的 组 所 组 成 。 

这 可 能 看 起 来 像 不 可 思议 的 约束 ， 但 是 它 似 乎 没有 它 最 初出 现时 那么 严格 了 6。 汇 编 器 将 
试图 通过 转换 操作 数 的 意义 (如 果 它 能 ) 来 转换 超 界 的 常数 值 。 例 如 ， 移 动 指令 (MOV) 将 
转换 为 移动 取 反 (move not, MVN) 指令 ， 它 会 将 字 中 的 所 有 位 取 反 。 而 且 ， 加 指令 将 被 转换 
为 减 指令 以 便 得 到 范围 内 的 操作 数 。 总 之 ， 如 果 汇 编 器 不 能 将 操作 数 限定 在 值 域 范 围 内 ， 它 
就 将 报告 一 个 汇编 错误 。 然 后 程序 员 可 能 会 再 增加 额外 的 指令 (例如 一 条 或 多 条 逻辑 或 指令 ) 
来 向 立即 数 中 放置 增加 位 。 在 任何 情况 下 ， 在 实际 编程 问题 中 产生 的 大 多 数 数字 (例如 字 节 
值 或 指针 地 址 ) 都 趋向 于 服从 这 些 规则 。 

就 存储 器 到 寄存 器 和 寄存 器 到 存储 器 而 言 ， 我 们 有 几 种 可 以 使 用 的 寻 址 模式 。 而 且 我 们 
也 必须 区 分 从 寄存 器 到 存储 器 的 寻 址 模式 和 那些 导致 存储 器 和 和 寄存 器 之 间 块 移动 的 指令 。 还 
要 注意 在 ARM 体 系 结构 中 没有 绝对 寻 址 模式 ， 所 有 的 存储 器 寻 址 模式 都 要 用 一 个 寄存 器 作为 
存储 器 指针 ， 不 管 是 寄存 器 本 身 还 是 作为 一 次 变 址 操作 的 基 址 寄存 器 。 你 可 能 很 惊讶 为 什么 
要 这 样 ， 因 为 所 有 的 ARM 指 令 (除了 Thumb 子 集 ) 都 是 单个 32 位 长 的 字 。 我 们 不 能 使 用 一 个 
绝对 地 址 作为 一 个 操作 数 ， 因 为 要 精确 地 指定 一 个 32 位 地 址 需要 第 二 个 指令 字 。 

请 看 下 面 的 例子 : 


LDR r12, [r7] 
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该 指令 将 寄存 器 r7 所 指向 的 存储 字 的 内 容 载 人 了 寄存 器 r12。 载 人 指令 的 格式 为 : 目的 一 源 。 
存储 指令 的 格式 相同 : 
STR r12, [r7] 
该 指令 将 r12 的 字 内 容 存 人 了 r7 所 指 的 存储 位 置 。 格 式 为 源 一 目的 。 糊 涂 了 ? 是 的 。 
在 这 两 个 例子 中 ，r7 中 存储 的 值 是 存储 器 访问 的 基地 址 。 如 果 我 们 正在 使 用 一 种 变 址 寻 
址 模式 ， 该 寄存 器 将 提供 地 址 计算 的 开始 值 。 我 们 可 以 总 结 字 或 无 符号 字 节 的 变 址 模式 ， 如 
下 表 所 示 : 





变 址 模式 描述 寄存 器 偏 移 立即 数 偏 移 比例 寄存 器 
不 写 回 的 前 变 址 “在 使 用 前 计算 地 址 [Rn, +Rm] [Rnyv# 士 Imm121] [Rn, +Rm,shift #imm] 
带 写 回 的 前 变 址 在 使 用 前 计算 地 址 ， [Rn, 土 Rm] 1! [Rn,#+tImml12]! [Rn, +Rm,shift #imm]! 
基 址 一 基 址 + 偏 移 
带 写 回 的 后 变 址 。” 在 使 用 后 计算 地 址 ， [Rn], +Rm [Rn] ,#+Imml2 [Rn] ,#+Rm, Shift #imm 
基 址 一 基 址 + 偏 移 


如 果 操 作 数 的 大 小 为 半 字 、 带 符号 的 半 字 、 带 符号 字 节 或 双 字 ， 那 么 可 用 的 变 址 模式 需 
要 稍微 修改 : 

















变 址 模式 描述 寄存 器 偏 移 立即 数 偏 移 比例 寄存 器 
不 写 回 的 前 变 址 在 使 用 前 计算 地 址 [Rn, 土 Rm] [Rn,#+ Imm8] N/A 
带 写 回 的 前 变 址 -在 使 用 前 计算 地 址 ， 基 址 一 基 址 + 偏 移 [Rn, 土 Rm]! [Rn,#+Imm8]! N/A 


带 写 回 的 后 变 址 在 使 用 后 计算 地 址 ， 基 址 一 基 址 + 仿 移 [Rn], +tRm {Rn],#+Imm8 N/A 


这 里 我 们 使 用 了 以 下 一 些 术语 

Rn: 基 址 寄存 器 Rm: 变 址 寄存 器 imm8 : 8 位 立即 数 偏 移 

Imm12，12 位 偏 移 1 : 带 写 回 shift， 移 位 操作 

下 面 的 指令 集 给 出 了 上 面 表格 中 的 几 种 变 址 寻 址 模式 的 例子 : 

例 1 LDR r12,[r0,+r7] 

基 址 寄存 器 r0 和 变 址 寄存 器 7 的 内 容 加 在 一 起 形成 一 个 对 齐 于 4 字 节 边界 的 存储 地 址 指针 
addr。addr 处 的 字 存 储 内 容 被 拷贝 到 寄存 器 r12。r0 的 内 容 未 被 改变 。 

例 2 LDRB r12,[r0,-#0x6A0] 

从 基 址 寄存 器 r0 的 内 容 中 减 去 立即 值 0x6A0 形 成 一 个 存储 地 址 指针 addr。addr 的 值 没 有 限 
制 。addr 处 的 字 节 内 容 被 拷贝 到 寄存 器 r12。r0 的 内 容 未 被 改变 。 

例 3 STR r12,[r0] ,+#0x6AO0 

寄存 器 r12 的 字 内 容 被 写 至 r0 所 指向 的 存储 位 置 。 当 数据 传送 发 生 后 立即 数值 0x6A0 被 加 
至 上 0 的 内 容 ， 其 和 存 回 至 r0。 

例 4 .STRH rl12,[r0,+r7]! 

基 址 寄存 器 r0 和 变 址 寄存 器 I7 的 内 容 加 在 一 起 形成 一 个 存储 地 址 指针 addr。 结 果 地 址 必须 在 
偶数 边界 。 寄 存 器 rl2 的 半 字 内 容 被 写 到 存储 地 址 addr。 此 由 寄存 哮 的 内 容 袍 新 泳 包含 什 ddr 

例 5 LDR r12,{r0,-r7,LSL #3]! 

变 址 寄存 器 17 的 内 容 逻 辑 左 移 3 位 。 

因此 ， 如 果 在 计算 前 <r7> = 0x00000AC4， 那 么 从 r0 减 去 的 值 将 为 (0x00000AC4) x8 = 
0x00005620。 


从 基 址 寄存 器 r0 中 减 去 结果 值 就 形成 了 存储 指针 addr。 结 果 地 址 必须 对 齐 于 4 字 节 边界 。 
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存储 在 存储 器 中 addr 处 的 字 值 被 拷贝 到 寄存 器 r12 中 ， 且 寄存 器 r0 被 更 新 为 值 addr。 

例 6 LDREQ r12,{[r0,-r7,LSL #3]! 

当 零 标志 2Z 被 置 位 时 执行 例 5 的 操作 。 

你 可 能 在 这 些 细 节 的 琐碎 介绍 中 遗漏 了 一 些 东 西 ， 所 以 我 将 在 这 里 提 及 一 下 。 如 果 在 地 
址 计算 中 使 用 的 基 址 寄存 器 是 程序 计数 器 r15， 那 么 所 有 的 变 址 寻 址 操作 都 是 与 pc 相对 的 和 位 
置 独立 的 。 回 忆 可 知 在 68K 中 我 们 必须 显 式 地 选择 一 种 pc 相对 的 寻 址 模式 。 在 ARM 体 系 结构 
中 ，pc 相 对 寻 址 只 是 选择 r15 作 为 基 址 寄存 器 时 的 附带 结果 。 


11.7 堆栈 操作 


ARM 体 系 结构 直接 强调 需要 一 套 有 效 机 制 以 支持 基于 堆栈 的 高 级 语言 、 外 加 载 和 人 和 存储 
指令 这 两 种 变型 ， 以 及 支持 压 栈 (push) 和 退 栈 (pop) 操作 的 额外 寻 址 模式 。 我 们 也 要 指出 
这 些 指令 不 仅仅 局 限于 堆栈 操作 ， 当 多 个 寄存 器 要 保存 时 也 是 非常 有 用 的 。 

这 两 条 指令 是 : 

LDM: 载 人 多 个 寄存 器 
STM: 保存 多 个 寄存 器 
这 两 条 指令 使 用 的 语法 与 68K 的 MOVEM 指 令 的 语法 非常 相似 。 需 要 保存 或 恢复 的 寄存 器 放 在 
括号 中 ， 可 以 用 一 个 连 字符 来 指示 一 个 连续 范围 内 的 寄存 器 ， 也 可 以 用 以 和 逗号 分 苔 的 寄存 器 
列表 来 指示 。 数 据 传 送 从 指向 存储 器 的 基 址 寄存 器 Ra 中 存储 的 地 址 开始 进行 。 当 数据 传送 发 
生 后 ， 指 针 寄 存 器 Rn 可 以 通过 添加 一 个 “!” 符 号 到 指令 中 来 选择 性 地 更 新 ， 就 像 我 们 刚刚 学 
过 的 变 址 寻 址 模式 一 样 。 这 种 寻 址 模式 区 别 于 变 址 寻 址 模式 的 地 方 在 于 使 用 的 寻 址 模式 是 附 
加 在 指令 操作 代码 后 而 不 是 放 在 操作 数 域 中 。 例 如 ， 为 了 从 存储 器 中 装载 寄存 器 r0 到 r3 且 使 得 
存储 指针 r10 在 每 一 次 数据 传送 后 都 递增 ， 我 们 使 用 以 下 指令 形式 ， 
1 LDMIA r10, {r0O-r3} 或 
2 LDMIA rl0o!, {rO-r3} 

假定 在 指令 执行 前 <r10> = 0xAABBCC00。 第 一 个 寄存 器 r0 从 存储 地 址 0xAABBCC00 处 
恢复 ， 寄 存 器 rl 从 存储 地 址 0xAABBCC04 处 恢复 ， 寄 存 器 r2 从 存储 地 址 0xAABBCC08 处 恢复 ， 
而 r3 则 从 地 址 0xAABBCCO0C 处 恢复 。 指 令 执行 完 后 : 

情况 (1); <r10> = 0xAABBCC00 
情况 (2): <r10> = 0xAABBCCOC 


多 个 寄存 器 传送 指令 有 4 个 寻 址 条 件 : 


助 记 符 描述 注释 
IA 后 递增 第 一 次 数据 传送 发 生 在 基 址 寄存 器 Rn 所 指向 的 存储 位 置 。 接 下 来 的 
传送 则 发 生 在 连续 的 更 高 存储 位 置 
. IB 前 递增 第 一 次 数据 传送 发 生 在 比 基 址 寄存 器 Rn 的 初始 值 高 4 个 字 节 的 存储 
位 置 。 接 下 来 的 传送 则 发 生 在 连续 的 更 高 存储 位 置 . 
DA 后 递减 第 一 次 数据 传送 发 生 在 基 址 寄存 器 Rn 所 指向 的 存储 位 置 。 接 下 来 的 
传送 则 发 生 在 连续 的 更 低 存储 位 置 
DB 前 递减 第 一 次 数据 传送 发 生 在 比 基 址 寄存 器 Rn 的 初始 值 低 4 个 字 节 的 存储 


位 置 。 接 下 来 的 传送 则 发 生 在 连续 的 更 低 存储 位 置 
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多 个 寄存 器 数据 传送 操作 的 语法 可 以 总 结 如 下 : 

LDM (可 选择 的 条 件 执行 ) ( 寻 址 模式 ) Rn (可 选择 的 更 新 ) ，{ 寄 存 器 列表 } 

STM (可 选择 的 条 件 执行 ) ( 寻 址 模式 ) Ra (可 选择 的 更 新 ) ，{ 寄 存 器 列表 } 

因此 ， 对 于 指令 : 

LDMNEIB rll!l, {r3, r5, r8} 
如 果 零 标志 被 清 零 ， 该 指令 将 会 把 寄存 器 r11+4 位 置 指 向 的 存储 地 址 的 内 容 载 入 寄存 器 r3、15 
和 r8。 假 定 指令 被 执行 ，rl11 中 的 值 将 会 增加 12 个 字 节 。 

为 了 专门 实现 标准 的 压 栈 和 退 栈 操作 ，ARM 为 我 们 刚才 讲述 的 4 种 寻 址 模式 定义 了 额外 的 . 
别名 助 记 符 。 在 讨论 它们 之 前 ， 我 们 应 当 花 一 点 时 间 回 顾 一 下 我 们 所 知道 的 栈 操作 。 

栈 是 后 进 先 出 (LIFO) 数据 结构 的 硬件 实现 。 和 我 们 在 68K 和 8086 体 系 结 构 中 所 看 到 的 
一 样 ， 栈 从 高 存储 地 址 向 低 存 储 地 址 方向 增长 ， 栈 指针 指向 当前 栈 顶 的 数据 。 当 数据 在 一 次 
退 栈 操作 中 从 栈 中 取出 时 需要 用 到 栈 指针 的 当前 值 ， 然 后 栈 指针 增加 该 存储 操作 数 的 大 小 。 
当 数 据 在 一 次 压 栈 操作 中 存 人 堆栈 时 ， 栈 指针 减少 相应 的 数量 ， 然 后 这 个 新 数据 被 添加 到 栈 
中 。ARM 的 定义 中 ， 这 种 类 型 的 堆栈 对 于 压 栈 操作 将 采用 前 递减 寻 址 模式 ， 而 对 于 退 栈 操作 
则 采用 后 递增 寻 址 模式 。 

然而 ， 我 们 并 不 是 必须 创建 一 个 使 用 这 种 模型 的 堆栈 ,我们 也 可 以 很 容易 地 建立 一 个 向 
高 存储 区 增长 、 向 低 存 储 区 缩减 的 堆栈 ， 这 对 于 使 用 ARM 处 理 器 的 硬件 和 软件 设计 者 来 说 肯 
定 更 加 灵活 。 如 果 我 们 决定 使 用 一 个 向 高 存储 地 址 增长 的 栈 ， 那 将 更 加 符合 我 们 头脑 中 的 
“增长 ” 栈 的 图 景 。 让 我 们 考虑 堆栈 的 这 种 模型 。 我 们 必须 决定 的 是 我 们 想 要 栈 指针 指向 什么 
地 方 和 我 们 想 要 它 怎 样 运行 。 假 设 我 们 想 要 压 入 一 个 数据 项 到 栈 中 ， 我 们 有 以 下 两 种 选择 ， 

1. 栈 指针 指向 堆栈 中 的 下 一 个 可 用 的 空白 空间 。 当 我 们 添加 一 个 元 素 时 ， 栈 指针 的 当前 
值 提 供 了 该 数据 指针 ， 然 后 栈 指针 被 递增 从 而 为 容纳 下 一 个 数据 项 做 准备 。 

2. 栈 指针 指向 最 后 压 入 栈 中 的 项 的 地 址 。 在 我 们 压 入 另 一 个 项 到 栈 中 之 前 ， 我 们 必须 在 
存储 数据 前 递增 指针 以 使 指针 指向 下 一 个 可 用 的 存储 地 址 。 

类 似 地 ， 当 我 们 进行 退 栈 操 作 时 也 有 两 种 选择 。 退 栈 操 作 的 选择 并 不 是 独立 于 压 栈 操作 
的 ， 当 我 们 选择 压 栈 的 一 种 策略 时 ， 退 栈 策略 也 就 确定 了 ， 反 之 亦 然 。 对 于 一 个 退 栈 操作 : 

1. 如 果 栈 指针 指向 栈 中 的 下 一 个 可 用 的 空白 存储 空间 ， 我 们 必须 首先 减少 栈 指 针 以 使 栈 
指针 指向 最 后 一 个 人 栈 的 项 ， 然 后 我 们 就 可 以 将 数据 载 人 寄存 器 了 。 

2. 如 果 栈 指针 指向 最 后 人 栈 的 项 ， 我 们 就 可 以 直接 装载 存储 器 ， 然 后 递减 栈 指针 值 。 

从 上 面 的 讨论 你 可 以 看 出 对 于 压 栈 操作 ， 第 一 种 情况 是 后 递增 (increment after) 的 例子 ， 
第 二 种 情况 是 先 递增 (increment before) 的 例子 。 对 于 退 栈 操 作 ， 第 一 种 情况 是 先 递减 
(decrement before) 的 例子 ， 第 二 种 情况 是 一 个 后 递减 (decrement after) 的 例子 。 

现在 回 到 堆栈 的 话题 。 这 4 种 堆栈 实现 的 选择 取 名 如 下 : 

1. 满 上 升 (Full Ascending): 这 是 一 种 满 堆栈 模型 。 栈 指针 指向 栈 中 最 后 填充 的 存储 位 
置 。 如 果 栈 在 增长 ， 我 们 需要 使 用 前 递增 方法 。 在 堆栈 助 记 符 中 ，IB 模 型 的 别名 是 FA。 

2. 满 下 降 (Full Descending ) :仍然 是 基于 满 模型 的 ， 在 将 数据 存 到 存储 器 之 前 我 们 必须 
递减 栈 指针 。 如 果 堆 栈 在 下 降 ， 我 们 就 必须 使 用 先 递减 方法 。 在 堆栈 助 记 符 中 ，DB 模 型 的 别 
名 是 FD。 

3. 空 上 升 (Empty Ascending) : 空 栈 模型 中 的 栈 指针 指向 栈 中 下 一 个 可 用 ( 空 ) 位 置 。 
如 果 栈 在 增长 ， 我 们 就 需要 使 用 后 递增 方法 。 在 堆栈 助 记 符 中 ，IA 模 型 的 别名 是 EA。 

4. 空 下 降 (Empty Descending): 如 果 栈 在 下 降 ， 我 们 就 需要 使 用 后 递减 方法 。 在 堆栈 助 
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记 符 中 ，DA 模 型 的 别名 是 ED。 

因此 ， 为 了 采用 满 下 降 模型 将 r7 到 r10 的 4 个 寄存 器 压 入 栈 中 ， 我 们 应 该 使 用 以 下 指令 : 

STMFD SP!, {r7-r10} 

注意 “SP” 是 寄存 器 r13 的 合法 别名 。 

在 一 些 应 用 中 我 们 实际 上 不 应 该 选择 多 数据 传送 指令 ， 尽 管 它们 提高 了 代码 密度 。 假 设 
从 外 设 来 的 时 间 要 求 非 常 高 的 中 断 进入 了 处 理 器 ， 那 么 它 必 须 尽 可 能 快 地 被 服务 ， 而 且 它 什 
么 时 候 可 得 到 服务 必须 是 高 度 可 预知 的 ， 或 者 说 ， 在 它 被 服务 前 必须 等 待 的 最 长 时 间 (潜伏 
期 ) 必须 是 高 度 可 预知 的 。 在 一 个 中 断 可 以 被 接收 前 ， 包 括 ARM 在 内 的 大 多 数 处 理 器 必须 完 
成 它们 正在 处 理 的 指令 。 使 用 多 数据 传送 指令 ， 我 们 就 会 增加 因 每 次 寄存 器 到 存储 器 的 数据 
传输 操作 而 产生 的 注 伏 期 。 尽 管 使 用 多 数据 传送 可 能 更 加 高 效 ， 但 我 们 还 是 应 当 使 用 一 组 更 
小 的 单个 数据 传送 操作 ， 以 使 中 断 等 待 的 最 长 时 间 为 一 条 简单 指令 的 执行 时 间 ， 该 时 间 可 能 
是 一 两 个 时 钟 周期 ， 而 不 是 20 个 或 更 多 的 时 钟 周 期 。 


11.8 ARM 指 令 集 


自从 ARM1 核 和 ARMv1 指 令 集体 系 结构 面世 以 来 ，ARM 指 令 集体 系 结构 就 一 直 在 不 断 发 
展 。ARM 系 列 一 直 在 不 断 地 向 前 发 展 ， 今 天 的 ARM11 核 支持 ARMv6 ISA。 为 达到 我 们 的 目 
标 ， 我 们 一 直 在 关注 并 将 继续 关注 ARMv4 体 系 结构 。 这 种 体系 结构 也 包括 ARMv4T 体 系 结构 ， 
它 包 含 16 位 压缩 的 Thumb 指 令 。 我 们 在 这 个 概述 中 将 不 再 讨论 Thumb 指 令 集 ， 但 是 我 们 鼓励 
感 兴趣 的 同学 参考 本 章 后 面 的 引文 仔细 学 习 Thumb 指 令 集 。 

所 有 的 ARM 指 令 都 是 32 位 字 长 的 ， 而 且 大 部 分 (不 是 全 部 ) 指令 都 是 在 一 个 时 钟 周期 内 
执行 的 。 例 外 的 情况 是 装载 和 存储 多 个 寄存 器 (LDM 和 STM) 的 指令 以 及 必须 添加 等 待 状 态 
的 到 慢 速 存储 器 的 装载 和 存储 操作 。 

我 们 可 以 将 ARM 指 令 集 分 成 4 类 指令 : 











1. 数据 处 理 指令 
2. 载 人 /存储 指令 
3. 转移 指令 
4. 控制 指令 
下 面 我 们 将 分 别 讨 论 每 种 类 型 的 一 个 典型 指令 示例 。 
数据 处 理 指令 
数据 处 理 指令 包括 下 面 两 条 寄存 器 数据 传送 指令 ; 
助 记 符 定 义 操作 模式 位 [25:21] 
MOvV 将 一 个 32 位 值 移动 到 寄存 器 1101 
MVN 将 一 个 32 位 值 的 补 码 移动 到 寄存 器 1111 


寄存 器 移动 指令 被 轨 入 数据 处 理 指令 可 能 会 让 你 感到 惊 订 。 严 格 地 说 ， 它 并 不 是 。 然 而 ， 
ARM 体 系 结构 假设 所 有 的 数据 处 理 操作 都 是 在 寄存 器 之 间 进 行 的 ， 而 载 和 和 存储 操作 发 生 在 
存储 器 和 寄存 器 之 间 。 因 此 ， 载 人 一 个 值 到 寄存 器 的 操作 被 归 人 数据 处 理 指 令 ， 不 管 这 个 值 
是 一 个 立即 数 还 是 另 一 个 寄存 器 的 内 容 。 

下 一 组 数据 处 理 指令 包含 算术 指令 : 
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助 记 符 定 义 操作 模式 位 [25:21] 
ADD 两 个 32 位 数字 相 加 0100 
ADC 带 进位 的 两 个 32 位 数字 相 加 0101 
SUB 两 个 32 位 数字 相 减 0010 
SBC 带 借 位 的 两 个 32 位 数字 相 减 0110 
RSB 两 个 32 位 数字 的 反 向 减 0011 
RSC 带 借 位 的 两 个 32 位 数字 的 反 向 减 | 0111 


反 向 减 操 作 允 许 减 法 中 使 用 的 两 个 寄存 器 操作 数 颠 倒 过 来 ， 所 以 如 果 对 于 SUB 指 令 是 Rd = 
Rn 一 Rm， 那 么 RSB 指 令 将 会 执行 Rd = Rm 一 Rn 操作 。 回 忆 可 知 Rm 所 代表 的 操作 数 也 可 能 是 一 
个 文字 或 者 一 个 寄存 器 的 移 位 值 ， 所 以 反 向 减法 指令 为 减法 操作 提供 了 进一步 的 灵活 性 。 

逻辑 操作 如 下 所 示 : 


助 记 符 定义 操作 模式 位 [25:21] 
AND 两 个 32 位 操作 数 按 位 与 0000 
ORR 两 个 32 位 操作 数 按 位 或 1100 
EOR 两 个 32 位 操作 数 按 位 异 或 0001 
BIC 按 位 逻辑 清 零 (与 非 ) 1110 


我 们 对 BIC 指 令 并 不 熟悉 。 逻 辑 上 它 是 Rd = Rn * ( Rm)。 因 为 Rm 的 各 位 被 取 反 ，Rm 中 任 
意 为 1 的 位 都 会 使 得 Rn 中 相应 的 位 被 清 零 、 因 此 ， 如 果 Rn = 0xAB 且 Rm = 0x01， 那 么 BIC 操 作 
将 得 到 Rd = 0xAA 的 结果 。 





助 记 符 定义 操作 模式 位 [25:21] 
CMP 两 个 32 位 值 进行 比较 1010 
CMN 取 反 的 比较 1011 
TEQ 测试 两 个 32 位 数字 是 否 相等 1001 
TST 测试 一 个 32 位 数字 的 各 个 位 (逻辑 与 ) 1000 


一 共有 16 条 数据 处 理 指 令 ， 指 令 的 格式 就 是 如 图 11-6 所 示 的 3 种 可 能 形式 之 一 。 指 令 一 共 
有 3 种 形式 ， 取 决 于 是 否 涉及 移 位 ， 或 者 第 3 个 操作 数 是 否 是 一 个 立即 数 。 位 25 叫 作 立 即 数位 ， 
如 果 第 3 个 操作 数 是 立即 数 则 该 位 为 1， 如 果 是 寄存 器 操作 数 则 为 0。 让 我 们 来 看 一 些 例子 。 如 


果 指令 的 格式 为 : 
ADD r0O, rl, #0x0O0ACO000 ; r0 = zl + 立即 数 

则 该 指令 采用 的 是 立即 操作 数 的 形式 。 指 令 代码 是 0xE28108AB 。 我 们 可 以 看 到 如 下 所 示 的 详 

细 解 析 : 


。 位 31:28 = 1 1 10。 总 是 执行 。 

。 位 27:25 = 00 1。 固 定 的 。 

。 位 24:21 = 0 100。 加 法 操作 代码 。 

。 位 20 =0。 指 令 设置 标志 的 结果 。1 = 设置 标志 ，0 = 不 设 标 志 。 
。 位 19:16 = 0001。 第 二 个 操作 数 寄存 器 = rl。 

。 位 15:12 =0000。 结果 寄 存 器 = r0。 

。 位 11:8 = 1000。 立即 操 作 数 0xAC 向 右 滚动 16 次 (2*< 滚 动 >) 。 
。 位 7:0=10101100， 立即 操作 数 。 





立即 操作 数 


3130 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11109876543210 


条 件 |001 | 操作 码 |s| Rn | Rd T 循环 | 立即 数 | 
移 位 的 立即 操作 数 


3130 29 28 27 26 25 24 23 22 21 20 19 18 17 16 1514131211109 8765432 
条 件 [000 | 课 作 码 S| “Rn ”] ”Ra ”| 立 且 移 包 性交 位 [o] Pim ”| 


移 位 的 寄存 器 操作 数 


3130 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 1211109876543210 


件 [000[ 操作 码 [s[ Rn | Rd [| Rs [ol 移 位 [1| Rm | 
图 11-6 ARM 数 据 处 理 指令 的 格式 


当 一 个 寄存 器 被 指定 为 第 二 个 操作 数 ， 并 且 一 个 移 位 值 也 被 指定 为 一 个 立即 操作 数 时 ， 

那么 就 使 用 立即 移 位 操作 数 形式 。 指 令 : 
ADD r3, r7, r4 ; rr3= Ir7 + r4 

的 指令 代码 为 0xE0873004。16 进 制 数字 中 的 3 位 最 低 有 效 位 意味 着 移 位 寄存 器 是 rz7 ， 移 位 的 类 
型 是 逻辑 左 移 ， 移 动 的 位 数 是 0。 

如 果 我 们 将 指令 改 为 : 

ADD r3, r7, r4, LSL #4 ; rr3 = r7 + (r4*16) 

则 指令 代码 就 变 为 0xe0873204， 译 码 后 就 是 4 位 的 LSL。 

最 后 一 个 例子 是 使 用 第 4 个 寄存 器 提供 移 位 计数 ， 


RDD r5, r6, r7, LSR r8 ; z5 w= r6 + 移 位 r8 


令 代 码 为 0xe0865837， 让 我 们 对 这 个 代码 进行 译 码 : 

。 位 3:0 =0111。 寄 存 器 r7 提 供 移 位 计数 。 

。 位 6:4= 0 11。 逻辑 右 移 。 

。 位 7 = 0。 固 定 值 。 

* 其 他 所 有 位 都 可 以 与 前 面 那个 例子 一 样 进行 译 码 

用 于 比较 的 指令 组 除了 设置 标志 外 不 会 产生 任何 的 结果 ， 因 此 ， 结 果 域 没有 被 使 用 。 在 
ARM 的 行 话 中 ， 那 个 域 被 定义 为 SBZ (should be zero) 。 该 域 任何 其 他 值 都 可 能 产生 不 可 预 
料 的 结果 。9 比 较 指 令 的 另 一 个 特征 是 它们 总 会 设置 标志 ， 所 以 S 位 的 状态 可 以 被 忽略 。 

数据 处 理 指令 的 下 一 组 是 关于 乘法 的 功能 非常 强大 的 指令 组 。 下 表 所 示 的 是 大 小 不 同 的 
乘法 指令 : 


助 记 符 描 述 语 法 


MUL 两 个 32 位 数字 相 乘 产生 一 个 32 位 的 结果 : Rd=Rm*Rs MUL{ 条 件 } {S} Rd, Rm, Rn 

MLA 两 个 32 位 数字 相 乘 ， 并 加 上 第 三 个 数 ， 得 到 32 位 的 。 MLA{ 条 件 } {S} Rd, Rm, Rn, Rs 
结果 : Rd= Rn + (Rm * Rs) 

UMULL 两 个 32 位 无 符号 数 相 乘 产生 一 个 无 符号 的 64 位 结果 ， “UMULL{ 条 件 } {S} RdLo, RaHi, Rm, Rs 
存储 在 两 个 寄存 器 中 : {RdHi][RdLo] = Rm * Rs 

UMLAL 两 个 32 位 无 符号 数 相 乘 ， 并 加 上 两 个 寄存 器 中 的 一 个 。 UMLAL{ 条 件 } {S} RdLo, RaHi, Rm, Rs 
无 符号 64 位 数 ， 产 生 一 个 存储 在 两 个 寄存 器 中 的 无 符 
号 64 位 结果 : [RdHilfRdLo] = 攻 dHi][RdLol + Rm* Rs 











日 这 里 有 一 个 关于 PC 界 无 恨 的 爱好 者 们 /先锋 们 的 精彩 故事 。 当 时 为 了 解决 未 实现 的 操作 码 到 底 会 完成 什么 工 
作 的 小 工业 已 经 初 具 规 模 。 换 句 话 说 , “如 果 SBZ 域 被 设置 为 001 将 会 发 生 什么 事 ? ”有 时 一 些 非常 有 趣 的 未 
记载 的 指令 被 发 现 后 ， 会 被 设计 成 商业 产品 。 不 幸 的 是 ， 当 CPU 制造 商 修改 芯片 时 ， 他 们 在 考虑 “ 谁 会 使 用 
它们 ”的 问题 后 经 常会 改变 那些 不 受 支持 的 指令 代码 的 编码 。 你 可 以 想像 当 一 批 新 的 处 理 器 大 量 投入 市 场 之 
际 产品 开始 失效 的 精 糕 情景 。 
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( 续 ) 
助 记 符 描述 语 法 
SMULL ”两 个 32 位 带 符号 数 相 乘 产生 一 个 存储 在 两 个 寄存 器 。 SMULL{ 条 件 } {Ss} RaLo, RdHi, Rm, Rs 
中 的 64 位 结果 
SMLAL 两 个 32 位 带 符号 数 相 莱 ， 并 与 在 两 个 寄存 器 中 的 一 。 SMLAL{ 条 件 } {S} RdLo, RdHi, Rm, Rs 
个 带 符号 64 位 数 相 加 ， 产 生 一 个 存储 在 两 个 寄存 器 中 
的 带 符号 64 位 结果 ，[RdHi][RdLo] = [RdHi][RdLo]+ 
Rm* Rs 


作为 指令 的 一 类 ， 乘 法 指 令 也 需要 执行 多 于 一 个 时 钟 周期 的 时 间 。 

最 后 ， 你 可 能 惊讶 于 ARM 指 令 集 不 包含 任何 除法 指令 。Sloss 等 "描述 了 用 于 将 除法 转化 为 
乘法 的 近似 方法 。 
载 入 /存储 指令 


寄存 器 和 存储 器 之 间 的 所 有 数据 传输 都 使 用 载 人 和 存储 类 指令 。 
所 有 的 存储 地 址 都 是 使 用 一 个 基 址 寄存 器 指针 与 一 个 额外 的 立即 数 偏 移 值 、 寄 存 器 值 或 


-比例 寄存 器 值 相 加 而 得 到 的 。 而 且 ， 计 算出 来 的 存储 地 址 指针 可 在 并 不 将 基 址 寄存 器 指针 更 


新 为 新 地 址 值 的 情况 下 使 用 。 最 后 ， 地 址 计算 可 能 会 在 指令 使 用 地 址 之 前 或 之 后 发 生 。 

载 人 /存储 指令 还 必须 处 理 操 作 数 的 大 小 和 类 型 ， 因 为 字 节 和 半 字 也 是 允许 的 。 

因为 我 们 在 寻 址 模式 讨论 中 已 经 涉及 了 很 多 关于 装载 /存储 指令 的 操作 ， 所 以 下 面 我 们 只 
是 简单 地 看 一 下 装载 /存储 指令 字 的 格式 。 

装载 寄存 器 指令 可 以 采用 以 下 形式 中 的 任意 一 种 : 








助 记 符 描述 句 尘 

LDR 将 一 个 32 位 存储 器 字 载 人 寄存 器 LDR{ 条 件 } Rn，< 地 址 模式 > 
LDRB 将 一 个 8 位 存储 器 字 节 载 人 寄存 器 LDRB{ 条 件 } Rn，< 地 址 模式 > 
LDRH 将 一 个 16 位 存储 器 半 字 载 人 寄存 器 LDRH{ 条 件 } Rn，< 地 址 模式 > 
LDRSB 将 一 个 8 位 带 符 号 存储 器 字 节 载 人 寄存 器 LDRSB{ 条 件 } Rn, < 地 址 模式 > 
LDRSH 将 一 个 16 位 带 符号 存储 器 半 字 载 人 寄存 器 LDRSH{ 条 件 } Ra，< 地 址 模式 > 


带 符号 字 节 和 半 字 数据 类 型 必须 使 用 特别 的 助 记 符 ， 因 为 当 从 存储 器 装载 到 寄存 器 时 ， 
这 些 值 必须 符号 扩展 到 32 位 。 对 于 32 位 存储 器 值 不 需要 特别 的 指令 ， 因 为 它 是 ARM 体 系 结构 
的 默认 数据 大 小 。 
图 11-7 显 示 了 字 或 无 符号 字 节 的 装载 /存储 指令 的 格式 。 注 意 装 载 和 存储 基本 上 是 相同 的 ， 
不 同 点 在 于 位 置 20 的 L 位 的 状态 。 指 令 格式 对 半 字 和 带 符号 字 节 有 一 些微 弱 的 区 别 。 
立即 数 偏 移 / 变 址 


3130 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5:4 3 2 1 0 


[条件 |o1lolp[ulelw Rn Rd 12 位 偏 移 
: 寄存 器 偏 移 / 变 址 


3130 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 


8 7 6 54 
[条件 [olilPluleIwh[| Rn T Rd [oooo0oool Rm | 
移 位 的 寄存 器 偏 移 / 变 址 


- 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 11 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 


| 条 件 |o1[iplulelwtl Rn T Rd 二 立即 移 位 [ 移 位 [o[ Rm | 


图 11-7 ARM 字 或 无 符号 字 节 装载 /存储 指令 的 格式 
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通用 域 的 意思 如 下 : 

。 位 31:28: 条 件 执 行 域 。 

。 位 27:25， 固定 的 。 

。 位 24: 对 于 前 变 址 模式 ，P = 1。 偏 移 被 加 到 基 址 寄存 器 ， 基 址 寄存 器 和 偏 移 的 和 被 用 
作 装 载 /存储 的 存储 器 地 址 。 对 于 后 变 址 模式 ，P = 0。 基 址 寄存 器 被 用 作 存 储 指针 ， 然 
后 偏 移 值 和 基 址 寄存 器 值 的 和 被 写 回 到 基 址 寄存 器 。 

。 位 23: 当 U = 1 时 偏 移 地 址 与 基 址 寄存 器 值 相 加 形成 存储 地 址 。 如 果 U = 0， 则 从 基 址 寄 
存 器 值 减 去 偏 移 地 址 。 

。 位 22: 当 B = 1 时 ， 访 问 的 存储 器 处 是 一 个 无 符号 的 字 节 。 如 果 B = 0， 那 么 访问 的 字 节 
就 是 一 个 32 位 的 字 。 

。 位 21: 如 果 位 P = 1， 那 么 位 W 将 决定 计算 出 来 的 存储 地 址 值 是 否 要 写 回 以 更 新 基 址 寄存 
器 。 如 果 W = 0， 基 址 寄存 器 不 被 更 新 。 如 果 位 P = 0 且 W = 1， 那 么 当前 访问 就 被 认为 B13] 
是 用 户 模式 访问 。 如 果 位 P = 0 且 W = 0， 那 么 就 被 认为 是 一 次 正常 的 存储 器 访问 。 

。 位 20， 如 果 L = 1 那么 这 是 一 次 存储 器 装载 操作 。 如 果 L = 0 那么 这 是 一 次 存储 器 存储 操作 。 

。 位 19:16: 基 址 寄存 器 指针 。 

。 位 15:12: 装载 操作 的 目的 寄存 器 或 者 存储 操作 的 源 寄存 器 。 

。 位 11:0: 取决 于 寻 址 模式 。 

让 我 们 看 看 存储 器 装载 和 存储 操作 的 一 些 例子 。 














助 记 符 描述 指令 代码 

LDR r5, [r8] 将 r8 所 指 的 字 载 入 r5 OxE5985000 

LDRSH r6, [r0O, -r2]! 将 r0-I2 所 指 的 带 符号 的 半 字 载 人 到 寄存 器 IS。 OxE13060F2 
在 存储 器 装载 操作 完成 后 将 tO 更 新 为 计算 的 地 址 值 

LDRNE rO, [r9, #-12]) 如 果 零 标志 = 0 则 条 件 执行 。 将 寄存 器 r9 所 指 的 字 值 。 ”0x1519000C 
减 去 12 个 字 节 载 人 寄存 器 r0。r9 中 的 值 不 改变 

LDRVCB rll, [r4], r2, 如 果 淤 出 标志 = 0 则 条 件 执行 。 将 寄存 器 r4 所 指 的 0x76D4B202 

LSL #4 无 符号 字 节 载 入 寄存 器 r11， 然 后 更 新 r4 使 得 r4 = r4 + 
r2*16 

LDR R8, [PC, r5] 将 程序 计数 器 (r15) 和 r5 的 当前 值 之 和 所 指 的 字 OxE79F8005 
值 载 人 寄存 器 I8 

STRB r7, [r3, #0xAA]! 将 寄存 器 17 的 无 符号 字 节 存储 到 r3+0xAA 所 指 的 存储 。 0xE5E370AA 
地 址 ， 将 和 写 回 到 寄存 器 r3 

STRCCH rl1ll, [r2, #-&A] 如 果 进 位 标志 =0 则 条 件 执行 。 将 寄存 器 ri1 中 的 半 0x3142BOBA 
字 存 入 r2 一 10 所 指 的 存储 地 址 ，R2 不 改变 

STREQ r0, [r4, r5, 如 果 零 标志 = 1 则 条 件 执行 。 将 寄存 器 r0 中 的 字 存 人  ” 0x078403A5 

lsr #7] r4+ (7r5 右 移 7 位 ) 的 和 所 指 的 存储 地 址 。R5 不 改变 

STRB ré6, [r4], r3 将 寄存 器 r6 中 的 字 节 存储 到 r4 所 指 的 存储 地 址 。 然 后 。” 0xE6C46003 
将 r3 和 r4 的 内 容 相 加 并 用 该 和 更 新 r4 

STRPLH ril, [r9, #-2]! 如 果 负 数 标 志 = 0 则 条 件 执行 。 将 寄存 器 r11 中 的 半 字 0x5169B0B2 


内 容 存 人 I9-2 所 指 的 存储 地 址 。 更 新 吗 为 新 地 址 





上 面 的 表格 应 该 让 你 对 单一 数据 传送 指令 运行 的 各 种 形式 的 语法 以 及 它们 是 怎样 被 编码 B314| 
为 一 个 32 位 指令 的 有 了 一 个 认识 。 
现在 让 我 们 来 看 看 多 数据 项 的 装载 和 存储 操作 的 几 种 形式 。 
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装载 多 个 寄存 器 和 存储 多 个 寄存 器 的 一 般 形式 如 图 11-8 所 示 。 位 域 15:0 中 的 各 位 对 应 于 将 
被 装载 或 存储 的 寄存 器 。 位 中 的 1 代表 相应 寄存 器 将 被 装载 或 存储 。 最 低 编号 的 寄存 器 被 存在 
最 低 存 储 地 址 ， 而 最 高 编号 的 寄存 器 被 存在 最 高 存储 地 址 。 


3130 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 


[ 条件 |100 [PulsIwlL[ Rn | 寄存 器 M 表 | 
图 11-8 ARM 多 寄存 器 载 和 人 /存储 操作 的 格式 | 


位 域 的 定义 如 下 : 

位 31:28: 条 件 执行 域 。 

位 27:25: 固定 的 。 

位 24: 当 P = 1 时 ， 地 址 在 存储 访问 前 递增 或 递减 (前 变 址 )。 当 P = 0 时 ， 先 使 用 当前 存 
储 指针 地 址 ， 然 后 存储 指针 才 被 改变 (后 变 址 )。 

位 23: 当 U = 1 时 每 一 次 传送 存储 地 址 都 递增 ， 当 U = 0 时 存储 地 址 递减 。 

位 22: 当 S=1 且 LDM 指 令 正 被 载 人 程序 计数 器 (r15) 时 ， 程 序 状 态 保存 寄存 器 (SPSR) 
将 被 装载 到 当前 程序 状态 寄存 器 〈CPSR ) 。 如 果 对 所 有 STM 指令 的 装载 指令 都 不 涉及 
r15， 那 么 位 S 指 明 当 处 理 器 在 优先 模式 时 ， 被 传送 的 是 标准 用 户 模式 寄存 器 而 不 是 当前 
模式 的 寄存 器 。 位 S 的 状态 通过 在 指令 末尾 附加 一 个 符号 “^” 来 置 位 。 

位 21: 如 果 W = 1， 指 针 寄存 器 将 在 多 寄存 器 传送 发 生 后 永久 更 新 。 由 于 每 个 数据 传送 
是 4 个 字 节 长 ， 存 储 器 指针 将 被 更 新 4 倍 次 的 寄存 器 传送 数量 。 如 果 W = 0， 寄 存 器 将 不 
被 更 新 。 

位 20， 如 果 L = 1 那么 将 会 发 生 一 次 存储 器 到 寄存 器 ( 载 人 ) 操作 。 如 果 L = 0 那么 将 会 
发 生 一 次 寄存 器 到 存储 器 (存储) 的 操作 。 

位 19:16: 表示 指针 寄存 器 。 

位 15:0; 寄存 器 列表 。 

多 数据 装载 或 存储 指令 的 通用 语法 格式 如 下 所 示 ， 括 号 中 的 是 可 选项 : 

LDM 或 STM{ 条 件 }XY Rn{!}，< 寄 存 器 列表 >{ 人 ^} 


这 里 ，XY 代 表 : 
。IA: 后 递增 
。IB: 前 递增 
。DA: 后 递减 
。 DB ， 前 递减 
下 面 是 多 数据 装载 和 存储 指令 的 两 种 表示 形式 。 


指 令 描述 指令 代码 


将 栈 指针 〈SP) 寄存 器 r13 所 指 的 存储 块 载 入 
到 寄存 器 r0、ri、r2、r3、r5、r7、r8 和 r9。 首 先 
将 地 址 SP-4 处 的 内 容 载 人 寄存 器 r8， 并 不 断 递减 OxE93D03AF 
SP 直到 r0 被 装载 。 更 新 SP 为 最 后 载 入 寄存 器 r0 的 
存储 字 

如 果 零 标志 = 0， 则 条 件 执行 这 条 指令 。 将 寄 
存 器 忆 到 r9 的 内 容 存 人 吃 所 指 的 存储 块 。 存 储 寄存 
器 r2， 然 后 为 下 一 次 存储 操作 递增 r0。 多 个 数据 
传送 操作 完成 后 ，r0 的 值 被 恢复 为 原来 的 值 


LDMDB SP!，{fr0-r3， 
r5, r7-r9} 


STMNEIA r0, {r2-r9} Ox188003FC 
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交换 指令 (SWP) 是 载 和 存储 操作 的 一 种 特殊 类 型 ， 它 用 于 交换 存储 位 置 的 内 容 与 寄存 
器 的 内 容 。 现 在 ， 你 可 能 会 认为 这 是 一 条 很 好 的 指令 ,但 是 它 并 不 太 适 合 我 们 这 种 计算 机 指 
令 集 体系 结构 的 精简 模型 。 难 道 你 不 能 用 一 个 传统 的 算法 去 交换 存储 器 和 寄存 器 的 内 容 吗 ? 
例如 ， 假 设 我 们 想 要 交换 r0 的 内 容 和 r10 所 指 存储 位 置 的 内 容 : 


MOV r8,r0 ; 将 r0 移 到 一 个 临时 寄存 器 
LDR r0,[r10] ; 得 到 存储 值 ， 交 换 的 一 半 已 完成 
STR r8,[r10] ; 保存 r8， 交 换 完成 
SWP r0，r0，[r10] ; 交换 <zI10> 和 rz0 
交换 指令 的 通用 形式 为 : 
SWP{B}{ 条 件 } Ra Rm, [Rn] 


这 里 ，Rn 所 指 的 存储 位 置 被 载 入 寄存 器 Rad， 且 存储 位 置 的 内 容 被 改写 为 Rm 中 的 值 。 因 此 ， 
在 通常 情况 下 ， 交 换 可 以 发 生 在 两 个 寄存 器 之 间 和 单个 的 存储 位 置 上 。 

问题 依然 存在 ,“ 为 什么 还 有 交换 指令 呢 ?” 答 案 是 因为 交换 指令 是 原子 (atomic) 操作 。 
原子 操作 是 不 能 被 中 断 的 。 大 多 数 指令 都 是 原子 指令 ， 也 就 是 说 ， 一 旦 一 条 指令 已 经 开始 ， 
且 处 理 器 接收 到 一 个 外 部 中 断 ， 该 指令 就 必须 在 中 断 被 服务 前 完成 。 在 上 面 那个 存储 器 到 寄 
存 器 交换 操作 的 例子 中 ， 我 们 需要 用 3 条 指令 完成 数据 传送 。 这 3 条 指令 并 不 是 原子 指令 ， 因 
为 中 断 可 能 会 使 数据 交换 的 过 程 出 现 间隙 。 如 果 中 断 也 要 在 这 些 寄存 器 或 存储 器 中 改变 数据 ， 
那么 数据 交换 可 能 会 被 破坏 。 交 换 指 令 是 通过 锁 存 总 线 使 得 另 一 个 事件 得 到 控制 权 之 前 必须 
完成 当前 指令 的 一 种 方式 。 | 


转移 指令 


有 两 种 形式 的 转移 指令 : 转移 (B) 和 带 连 接 的 转移 (BL)。 指 令 都 很 相似 ， 不 同 的 是 带 
连接 指令 的 转移 在 BL 指令 后 自动 地 将 下 一 条 指令 的 地 址 保存 到 了 寄存 器 r14 中 。 这 只 是 一 次 子 
程序 调用 。 为 了 从 子 程序 返回 ， 你 只 要 将 连接 寄存 器 拷贝 到 程序 计数 器 就 可 以 了 。 

MOV PC, LR 

转移 指令 的 范围 是 +/-32MB 。 像 68K 一 样 ，ARM 体 系 结构 中 的 转移 指令 是 一 个 PC 相对 位 
移 。PC 的 当前 值 加 上 或 者 减 去 该 位 移 并 将 这 个 新 值 重新 载 人 PC ， 就 实现 了 一 个 程序 转移 。 转 
移 指令 的 格式 如 图 11-9 所 示 。 


3130 29 28 27 26 25 24 23 22 21 20 19 18 17 16 1 14 13 12 11 1 9 8 7 6 5 4 3 2 1 0 


-|]1011|L 24 位 偏 移 
图 11-9 ARM 转 移 指 令 和 带 连 接 转移 指令 的 格式 


转移 地 址 的 计算 如 下 : 

1. 24 位 的 偏 移 值 被 符号 扩展 到 32 位 。 

2. 结果 左 移 2 位 〈 乘 以 4) 以 提供 一 个 字 对 齐 的 位 移 值 ， 或 者 说 一 个 有 效 的 26 位 字 地 址 。 
3. 位 移 被 加 到 程序 计数 器 ， 结 果 存 回 到 程序 计数 器 。 


软件 中 断 指令 


软件 中 断 指令 允许 应 用 代码 通过 存储 在 存储 器 中 的 向 量 来 改变 程序 执行 的 上 下 文 。 这 条 
指令 类 似 于 68K 的 TRAP 指 令 和 8086 的 INT 指 令 。 通 常 ， 软 件 中 断 (SWI) 被 应 用 程序 用 来 产 
生 一 个 到 操作 系统 服务 的 调用 。 
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由 于 SWI 指 令 被 用 于 改变 上 下 文 ， 所 以 它 也 必须 保存 当前 处 理 器 的 上 下 文 以 便 它 能 够 在 
中 断后 返回 。SWI 的 行为 如 下 : 

1. 将 SWI 指 令 后 的 指令 地 址 保存 到 寄存 器 r14_svc。 

2. 将 CPSR 存 人 SPSR_svc。 

进入 管理 模式 并 屏蔽 正常 的 中 断 ， 但 不 包括 快速 中 断 请 求 。 

3. 将 PC 装载 为 地 址 0x00000008 并 执行 那里 的 指令 。 

我 们 并 不 使 用 异常 向 量 表 作为 一 个 软件 中 断 服务 程序 开始 处 的 间接 地 址 ， 而 是 利用 向 量 
表 位 置 所 包含 的 一 条 指令 空间 来 转移 到 代码 的 开始 处 。 如 果 你 考虑 的 是 68K 的 向 量 表 组 织 ， 这 
看 起 来 就 很 奇怪 ， 但 对 于 ARM 体 系 结构 而 言 这 确实 没什么 关系 ， 因 为 所 有 的 指令 都 是 一 个 字 
长 ， 你 不 需要 使 用 间接 指针 去 得 到 ISR 代 码 的 开始 位 置 。Motorola 必 须 使 用 一 个 向 量 是 因为 无 
条 件 跳 转 指令 会 占用 太 多 的 空间 。 然 而 ， 因 为 一 条 ARM 指 令 与 一 个 地 址 占用 了 相等 的 空间 ， 
所 以 每 种 方法 都 可 以 。 

软件 中 断 指 令 也 包括 一 个 24 位 的 立即 操作 数 域 ， 该 域 被 用 于 将 参数 传送 到 中 断 服务 子 程 
序 。 因 此 ， 使 用 一 个 单一 向 量 代替 了 多 个 软件 中 断 向 量 ， 但 是 所 要 求 的 中 断 服 务 类 型 信息 可 
以 被 传 到 指令 的 操作 数 域 。 


程序 状态 寄存 器 指令 


最 后 将 要 学 习 的 ARM 指 令 类 型 包含 两 条 实现 了 CPSR 或 SPSR 寄 存 器 与 通用 寄存 器 之 间 的 
载 入 或 存储 操作 的 指令 。 这 两 条 指令 的 句法 如 下 所 示 : 

MRS{ 条 件 } Rd，<cpsr 或 spsr> 

MSR{ 条 件 } ”<cpsr 或 spsr>_< 域 >，Rm 

MSR{ 条 件 } ”<cpsr 或 spsr>_< 域 >，# 立 即 数 | 
MRS 指 令 用 于 将 CPSR 或 SPSR 的 当前 值 移 至 一 个 通用 寄存 器 。MSR 指 令 用 于 将 一 个 通用 寄存 
器 的 内 容 或 一 个 立即 数值 移入 CPSR 或 SPSR。 

下 面 是 关于 状态 寄存 器 指令 的 一 些 解释 。 如 果 处 理 器 在 用 户 模 式 下 且 指 令 试 图 修改 除了 
标志 域外 的 其 他 域 ， 那 么 这 条 指令 就 会 被 忽略 。 为 了 使 这 条 指令 被 执行 ， 处 理 器 必须 处 于 那 
些 特权 模式 中 的 一 种 ， 因 为 程序 状态 寄存 器 只 有 在 处 理 器 运行 在 特权 模式 下 时 才能 被 修改 。 

域 变量 的 值 如 下 所 示 : 

。_C: 控制 域 表 示 程 序 状态 寄存 器 的 位 0 到 位 7， 进 一 步 细 分 为 : 

一 位 0:4; 处 理 器 模式 

一 位 5: 使 能 Thumb 模 式 

一 位 6; 使 能 快速 中 断 请 求 模式 
一 位 7: 使 能 中 断 请 求 模式 

。_X: 扩展 域 表 示 位 8:15。 目 前 这 个 域 没 有 被 使 用 ， 只 是 为 ARM 以 后 的 扩展 保留 的 。 这 
些 位 不 应 该 被 修改 。 

_S: 状态 域 表 示 位 16:23。 目 前 这 个 域 没 有 被 使 用 ， 只 是 为 ARM 以 后 的 扩展 保留 的 。 这 
些 位 不 应 该 被 修改 。 
。_F; 标志 域 表示 位 24:31。 这 个 域 被 进一步 细 分 为 : 

一 位 28: 位 V 一 溢出 标志 

一 位 29: 位 C 一 进位 标志 

一 位 30: 位 Z 一 零 标志 

一 位 31; 位 N 一 取 反 标志 





立即 操作 数 只 能 修改 标志 域 的 位 。 而 且 ， 为 了 防止 不 小 心 修改 程序 状态 寄存 器 中 不 应 修 
改 的 位 ， 程 序 状态 寄存 器 应 该 采取 以 下 三 个 步 又 来 修改 : 

1. 使 用 MRS 指 令 将 PSR 的 内 容 拷贝 到 一 个 通用 寄存 器 ， 

2. 修改 通用 寄存 器 的 适当 位 ， 

3. 使 用 MSR 指 令 将 通用 寄存 器 拷贝 回 PSR 。 


下 面 的 指令 序列 使 能 FIR 模 式 : 
MRS “IrI6, c_spsr ; 将 spsr 拷 由 到 r6 
MOV Ir7, #&40 ; 将 位 6 置 为 1 


ORR  r6,r7,r6 ; 置 位 
MSR c_spsr,，r6 ; 重新 载 人 寄存 器 


域 的 位 在 逻辑 上 是 “或 ”在 一 起 的 ， 因 此 ， 举 个 例子 ， 你 可 以 使 用 cxsf_cpsr 去 修改 cpsr 的 
所 有 域 。 

MSR 和 MRS 指 令 的 格式 如 图 11-10 所 示 。 如 果 位 R = 1， 则 使 用 的 程序 状态 寄存 器 是 SPSR， 
如 果 R = 0， 则 程序 状态 寄存 器 是 CPSR 寄 存 器 。 立 即 数 域 以 循环 域 所 给 出 的 次 数值 进行 循环 ， 
使 得 相应 位 移动 到 PSR 的 标志 位 。 


MSR 
3130 29 28 27 26 25 2423222120191817161514131211109876543210 


| 条 件 [ooo10[RJooJ1111| Rg [Joo0000000000] 


MSR 立即 数 形式 
3130 29 28 27 26 25 24 23 222120191817161514131211109876543210 


| 条 件 | 00110 JR|19[ 域 掩 码 [1111[ 循环 | 立即 数 
MSR 寄存 器 形式 
313029282726252423222120191817161514131211109876543210 


| 条 件 | 00010 |R[10] 域 掩 码 J1+111]J00000000]o] Rm | 
图 11-10 ARM 修 改 状态 寄存 器 的 指令 格式 


11.9 ARM 系 统 向 量 


与 68K 和 8086 体 系 结构 相 比 ，ARM 体 系 结构 中 的 系统 向 量 相 对 较 少 。 如 下 表 所 示 总 共 只 
有 8 个 系统 向 量 : 


异常 向 量 地 址 
重启 0x00000000 
未 定义 指令 0x00000004 
软件 中 断 0x00000008 
预 取 异常 中 断 0x0000000C 
数据 异常 中 断 0x00000010 
保留 0x00000014 
中 断 请 求 0x00000018 
快速 中 断 请 求 0x0000001C 


快速 中 断 请 求 (FIR) 向 量 是 表 中 最 后 一 个 向 量 是 因为 该 向 量 并 不 是 显而易见 的 。 回 忆 可 
知 ， 每 个 向 量 都 是 32 位 的 字 ， 刚 好 能 够 装 下 一 条 指令 。 该 指令 通常 是 到 用 户 服务 子 程序 人 口 
的 转移 指令 。FIR 向 量 位 于 表格 的 顶端 以 便 FIR 服 务 子 程序 能 够 从 地 址 0x0000001C 开 始 并 从 那 
里 继续 ， 而 不 需要 添加 一 条 转移 指令 来 获得 实际 代码 。 如 果 想 要 速度 快 ， 每 一 个 时 钟 周期 都 
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很 重要 ! 

当 处 理 器 试图 在 没有 权力 访问 某 条 指令 的 情况 下 从 一 个 地 址 取得 该 指令 时 ， 就 要 使 用 预 
取 异 常 中 断 向 量 。 它 被 称 为 预 取 异 常 中 断 是 因为 实际 的 指令 译 码 发 生 在 指令 被 取 之 后 ,但 是 
异常 实际 上 是 在 预 取 指 令 的 期 间 发 生 。 当 我 们 在 后 面 一 章 学 习 流水 线 处 理 器 时 ， 我 们 将 更 深 
入 地 学 习 这 些 内 容 。 

数据 异常 中 断 向 量 除 了 是 针对 数据 的 之 外 ， 与 预 取 异 常 中 断 向 量 相同 。 因 此 ， 数 据 异 党 
中 断 发 生 在 处 理 器 试图 在 没有 正确 访问 权 的 情况 下 从 一 个 地 址 区 域 取 数据 的 时 候 。 

重启 向 量 也 是 独特 的 ， 因 为 当 重启 中 断 被 确认 时 处 理 器 将 立即 停止 执行 并 开始 重启 序列 。 
对 于 其 他 异常 ， 处 理 器 将 在 接受 异常 序列 之 前 完成 当前 指令 。 当 然 ， 这 是 非常 有 意义 的 ， 因 
为 重启 操作 不 需要 恢复 系统 上 下 文 ， 所 以 你 就 可 以 尽 可 能 快 地 开始 该 指令 。 
总 结 


"= 


ARM 指 令 集 是 一 个 全 新 的 32 位 RISC 指 令 集 。 与 8086 和 68K 处 理 器 不 同 ， 除 了 一 小 部 分 指 
令 在 一 个 时 钟 周期 内 执行 的 例外 情况 ， 所 有 指令 的 长 度 都 是 相同 的 。 寄 存 器 集 几乎 完全 通用 。 
16 个 用 户 模式 寄存 器 中 只 有 3 个 是 专用 的 。 所 有 的 数据 处 理 指 令 都 发 生 在 寄存 器 之 间 ， 而 且 所 
有 的 存储 器 操作 都 被 限制 为 存储 器 到 寄存 器 的 载 人 操作 和 寄存 器 到 存储 器 的 存储 操作 。 所 有 
的 存储 器 访问 都 使 用 一 个 通用 寄存 器 作为 基 址 存储 指针 。 附 加 的 有 效 寻 址 模式 通过 增加 递增 
寄存 器 、 递 减 寄存 器 、 变 址 寄存 器 、 立 即 偏 移 值 和 比例 寄存 器 进一步 增强 了 这 种 模式 。 

虽然 你 可 能 并 不 同意 ， 但 ARM 指 令 集体 系 结构 确实 比 我 们 前 面 接触 过 的 体系 结构 要 简单 得 
多 ， 严 格 得 多 。 这 种 简单 性 更 加 依赖 于 可 以 生成 最 优化 代码 流 因而 也 是 最 高 效 代 码 的 编译 器 。 

通过 这 一 章 对 ARM 体 系 结构 的 概述 ， 我 们 将 搓 下 通用 体系 结构 的 学 习 而 转移 到 其 他 话题 。 
当 在 后 面 一 章 详细 学 习 流 水 线 时 我 们 将 再 一 次 回 到 对 体系 结构 的 学 习 。 那 时 ， 我 们 将 再 一 次 
回 到 ARM 体 系 结 构 ， 但 是 我 们 下 一 次 将 在 一 个 更 高 的 层次 讨论 问题 。 虽 然 你 们 中 的 有 些 人 在 
阅读 这 些 章节 的 时 候 可 能 已 经 发 现 ， 这 就 如 同 看 着 绘画 变 干 一 样 令 人 兴奋 ， 但 也 有 使 人 发 疯 
的 方法 。 为 了 从 软件 的 角度 来 理解 计算 机 的 体系 结构 ， 我 们 必须 学 习 一 些 关于 很 多 位 模式 是 
怎样 被 用 来 形成 指令 字 的 例子 。 

美国 公共 电台 的 演员 Science 博 士 曾经 说 过 ;“ 我 喜欢 读 取 一 列 列 的 随机 数字 并 从 中 找 出 
规律 。” 

本 章 讲 述 了 以 下 内 容 : 

。ARM 体 系 结构 的 发 展 简 史 

“ARM7TDMI 处 理 器 体系 结构 的 概述 

。ARM 指 令 集 和 寻 址 模式 的 介绍 
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习题 


1. ARM 系 统 的 操作 模式 是 什么 ? 与 68K 相 比较 它们 是 怎样 的 ? 
2. 为 什么 要 有 快速 中 断 请 求 模式 ? 它 是 如 何 实现 的 ? 
3. 将 ARM 体 系 结构 中 的 16 个 基 址 寄存 器 和 68K 体 系 结构 中 的 16 个 寄存 器 进行 比较 。 
4. 指令 
MOV r4, #&103 
是 合法 指令 还 是 非法 指令 ? 为 什么 ? 注 : &103 是 16 进 制 数 的 ARM 表 示 。 
5. 写 一 段 代码 将 立即 数值 &103 载 入 寄存 器 "4。 
6. 用 值 &06AA4C01 初 始 化 寄存 器 1I7 。 
7. 假设 寄存 器 r8 的 内 容 = &0010AA00 且 寄存 器 r6 的 内 容 = &0000CFD3。 当 下 面 的 指令 执行 完 
后 寄存 器 r11 中 存储 的 值 是 什么 ? 
ADD rll,r8,r6LSL #2 
8. 将 下 面 的 68K 指 令 重 写 为 等 价 的 ARM 操 作 。 提 示 : 不 要 忘记 标志 (flag)。 
ADD.L D3, $00001000 
9. 假定 <rl> = &DEF02340。 尽 可 能 详细 地 描述 下 面 指令 执行 的 操作 ， 


LDRNEH r4, [ri, #4]! 





第 12 章 与 外 部 接口 


学 习 目 标 

。 描 述 为 什么 中 断 是 计算 机 和 外 部 世界 相互 作用 所 固有 的 ， 
。 解 释 为 什么 中 断 要 设 定 优先 级 ， 

。 理 解 1O 端 口 的 概念 ， 

。 解 释 模 拟 信号 和 数字 信号 之 间 如 何 进行 相互 转换 ， 

。 理 解 模拟 到 数字 转换 过 程 中 ， 速 度 和 精确 性 的 折 中 问题 。 


12.1 引言 


在 前 面 课程 中 ， 我 们 看 到 只 能 在 自身 环境 内 运行 而 不 能 与 外 部 世界 交互 的 计算 机 是 相 
当 无 用 的 ， 虽 然 这 对 于 学 习 体 系 结构 是 一 个 好 的 环境 ， 但 其 所 有 益处 也 仅 限 于 此 。 当 你 能 
够 用 TRAP #15 指 令 将 输入 和 输出 功能 (IO) 加 入 到 你 的 程序 当中 时 ， 会 有 某 种 耳目 一 新 
的 感觉 (我 希望 ) 。 现 在 ， 让 我 们 通过 图 12-1 开 始 对 计算 机 和 外 部 世界 的 讨论 。 图 中 虚线 内 
的 部 分 表示 计算 机 运行 所 需要 的 最 少量 的 组 件 ， 虚 线 外 部 表示 计算 机 能 做 有 用 工作 所 需 的 
所 有 其 他 部 分 。 





随机 访问 存储 
器 -RAM 












| : 到 外 部 世界 
到 其 他 设备 
到 主 计算 机 
到 用 户 MF 


图 12-1 一 个 典型 的 计算 机 系统 。 显 示 在 虚线 内 的 功能 模块 是 使 计算 机 能 实际 运行 的 最 小 需求 

如 你 所 见 ， 处 理 器 、 存 储 器 阵列 、 粘 结 逻 辑 (存储 器 译 码 等 ) 以 及 时 钟 构成 了 基本 的 计算 机 ， 
但 这 个 计算 机 相对 人 而 言 是 无 价值 的 。 我 们 需要 能 以 某 种 方式 与 外 部 刺激 进行 交互 (接口 )。 

外 部 世界 (真实 世界 ) 有 其 自身 的 一 组 约束 ， 我 们 必须 能 够 处 理 它 。 与 你 的 PC 主板 相 比 ， 
外 部 世界 是 非常 杂乱 的 。 其 中 的 一 些 约束 是 : 
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。 外 部 事件 在 本 质 上 通常 不 是 数字 的 ， 

。 与 计算 机 中 的 基本 时 钟 周 期 相 比 ， 外 部 事件 的 发 生 频率 有 很 大 差异 ， 

。 外 部 事件 是 短暂 的 ， 如 果 未 在 适当 时 间 内 得 到 服务 ， 事 件 可 能 会 消失 ， 

。 外 部 事件 通常 发 生 于 脏 、 湿 、 极 热 、 极 冷 、 或 者 有 大 量 背 景 噪声 ( 电 干 扰 ) 的 环境 ， 

。 服务 于 外 部 事件 的 计算 机 的 失效 有 外 部 的 后 果 。 关 键 系统 可 能 会 失效 (2000 年 问题 )， 

或 者 可 能 有 人 形 生 。 

如 果 我 们 要 接受 一 种 事实 ， 即 有 必要 从 外 部 的 混沌 中 制造 出 某 种 秩序 ， 那 么 我 们 首先 就 
需要 了 解 外 部 和 计算 机 之 间 是 如 何 相互 通信 的 。 由 于 事件 发 生 的 频率 有 很 大 差异 ， 所 以 我 们 
需要 能 使 我 们 在 计算 机 环境 的 内 部 和 外 部 之 间 进 行 同 步 的 方法 。 我 们 要 讨论 的 第 一 种 方法 就 
是 中 断 的 概念 。 


12.2 ”中断 


到 此 我 们 已 经 在 处 理 器 和 存储 器 方面 考察 了 计算 机 系统 。 加 入 一 个 时 钟 后 ， 这 就 是 一 个 
功能 上 的 计算 机 了 ， 但 却 是 一 个 无 用 的 计算 机 。 在 前 面 的 课程 中 ， 你 可 能 会 注意 到 中 断 
(interrupt) 这 个 词 偶尔 在 这 里 或 那里 闪现 ， 现 在 ， 我 们 就 来 了 解 一 下 中 断 到 底 是 什么 。 回 忆 
可 知 ， 当 在 前 面 章节 学 习 计算 机 体系 结构 时 ， 我 们 实际 上 提 到 了 中 断 。 特 别 地 ， 我 们 看 到 了 
ARM 体 系 结 构 和 它 的 中 断 以 及 它 的 快速 中 断 请 求 模 式 ， 我 们 还 看 到 了 软件 中 断 和 它们 如 何 改 
变 处 理 器 的 上 下 文 环 境 以 及 访问 操作 系统 。 现 在 ， 让 我 们 返回 来 考察 中 断 过 程 本 身 。 

为 了 使 计算 机 值得 你 为 其 付出 电力 成 本 ， 它 就 必须 能 与 你 和 环境 相互 作用 。 你 操纵 键盘 
和 鼠标 ， 计 算 机 以 屏幕 动作 、 声 音 、 磁 盘 访 问 等 作为 响应 。 如 果 有 时 发 生 了 被 称 为 异常 
(exception) 的 意外 事件 ， 计 算 机 必须 有 能 力 来 对 付 它们 。 一 个 典型 的 异常 可 能 是 漂浮 不 定 的 
指针 所 产生 的 结果 ， 它 导致 程序 试图 从 实际 上 并 没有 存储 器 的 区 域 中 去 取 数 据 。 或 者 ， 你 试 
图 用 零 去 除 。 

当 处 理 器 内 部 和 外 部 的 异步 事件 需要 吸引 处 理 器 的 注意 时 ， 它 们 通过 生成 中 断 来 达到 此 
目的 。 中 断 强制 处 理 器 中 止 其 正常 的 程序 执行 ， 并 开始 执行 另 一 个 称 为 中 断 服 务 程序 
(interrupt service routine，ISR) 的 代码 块 。ISR 程 序 代码 结束 后 ， 中 断 已 得 到 处 理 ， 处 理 器 返 
回 到 离开 的 地 方 并 恢复 应 用 代码 的 执行 。 

假设 我 们 没有 中 断 ， 处 理 器 为 了 照顾 到 这 些 事件 ， 它 就 不 得 不 周期 性 地 检测 每 个 可 能 请 
求 服务 的 事件 ， 看 看 事件 是 否 准 备 好 接受 服务 。 一 个 恰当 的 类 比 就 是 电话 铃 。 你 正在 吃 晚 餐 
(应 用 ) ， 电 话 铃 响 了 (中 断 ) ， 你 放下 叉子 接 电话 (ISR)， 你 告诉 电话 推销 员 你 不 想 要 这 个 去 
纽 芬 兰 里 维 埃 拉 度 假 胜 地 的 免费 度假 的 机 会 ， 然 后 你 回来 继续 就 餐 (从 中 断 返 回 ) 。 

现在 ,假设 你 的 电话 铃 坏 了 。 你 要 得 知 是 否 有 人 给 你 打 电 话 的 唯一 办 法 就 是 每 过 几 分 钟 
就 拿 起 电话 说 :“ 喂 , 喂 ， 有 人 吗 ? ”在 计算 机 中 这 个 类 似 的 过 程 称 为 轮 询 (polling)， 它 很 
快 就 变 得 过 时 了 。 在 一 个 轮 询 系统 中 ， 计 算 机 周期 性 地 检查 每 个 可 能 请 求 服务 的 事件 ， 这 将 
作为 其 常规 程序 代码 的 一 部 分 。 当 应 用 服从 于 轮 询 结构 时 ， 轮 询 就 仍然 是 一 种 非常 可 接受 的 
计算 机 编程 方式 。 防 盗 自动 警 铃 控 制 器 就 是 轮 询 系统 的 一 个 极 好 例子 。 程 序 依 次 检查 每 个 传 
感 器 ， 看 看 是 否 被 夜 贼 或 家 猫 绊 住 。 如 果 一 个 传感器 被 绊 住 ， 程 序 就 打开 报警 铃 。 程 序 在 称 
为 轮 询 循环 (polling loop) 的 连续 循环 中 运行 ， 并 同时 检查 传感器 。 

你 可 能 会 想像 到 ， 当 一 台 计 算 机 在 轮 询 其 外 部 设备 看 是 否 需 要 服务 时 ， 它 就 不 能 多 做 别 
的 事情 ， 这 就 是 我 们 需要 中 断 的 原因 。 因 为 中 断 是 异步 的 ， 所 以 其 发 生 的 多 与 少 有 些 随 机 性 ， 
因此 处 理 器 就 “ 按 需 ”对 其 进行 处 理 。 然 而 ， 我 们 不 应 无 视 这 样 的 事实 ， 就 是 中 断 既 可 能 随 
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机 发 生 ， 也 可 能 在 精确 的 时 间 间 隔 发 生 。 例 如 ， 你 的 Windows 操 作 系 统 有 外 部 定时 器 每 隔 几 
毫秒 就 提供 时 钟 滴 答 ， 而 其 他 系统 可 能 有 规律 地 在 每 几 微 秒 就 有 中 断 出 现 。 关 键 的 一 点 是 中 
断 不 与 我 们 程序 的 执行 同步 。 现 在 ， 让 我 们 考察 一 下 你 在 一 个 计算 机 系统 中 可 能 会 遇 到 的 一 
些 通常 的 中 断 类 型 。 

最 常见 的 中 断 是 复位 ( RST )。 复 位 是 一 个 非常 引 人 注 目的 中 断 ， 它 从 头 启动 处 理 器 。 它 
不 像 其 他 中 断 那 样 返回 到 它 在 应 用 中 离开 的 那 一 个 点 。 复 位 中 断 假设 任何 事情 都 是 可 疑 的 ， 
你 真正 想 做 的 是 从 起 始点 开始 。 当 你 通过 在 计算 机 上 按 复位 健 而 使 复位 有 效 时 ， 就 引起 了 以 
下 事件 序列 的 发 生 : 

1. 清除 内 部 寄存 器 的 内 容 ， 

2. 将 处 理 器 确立 在 一 个 已 知 的 状态 ， 

3. 从 一 个 已 知 的 存储 器 位 置 开始 执行 程序 。 | 

请 注意 ， 上 述 过 程 是 复位 中 断 的 一 般 动 作 序列 。 如 前 所 见 ， 不 同 处 理 器 用 不 同 的 方式 启 
动 。 现 代 奔 腾 和 Athlon CPU 在 复位 有 效 时 ， 有 非常 复杂 的 启动 序列 。 

如 果 你 在 硬件 级 别 考 察 复 位 中 断 ， 你 就 会 惊讶 地 发 现 ， 为 了 使 复位 工作 完全 ， 你 必须 在 
相当 多 的 时 钟 脉冲 内 保持 复位 输入 有 效 ， 这 就 是 算法 状态 机 在 幕后 忙碌 的 暗示 。 典 型 情况 是 ， 
为 了 将 状态 机 引入 到 正确 状态 ， 复 位 输入 可 能 要 在 50 个 到 几 百 个 时 钟 周 期 内 保持 有 效 。 

有 了 时 我 们 关心 ， 为 进行 中 断 服务 我 们 可 以 用 多 长 的 时 间 。 如 果 我 们 正 试图 捕获 和 处 理 一 
个 快速 的 数据 流 (比如 数字 视频 便携 式 摄像 机 ) ， 而 且 我 们 不 想 丢 失 任何 帧 ， 那 么 我 们 就 可 能 
会 给 这 个 中 断 以 一 个 较 高 的 优先 级 。 

另 一 个 因素 可 能 对 于 中 断 至 关 重 要 。 大 多 数 膝 上 计算 机 都 有 一 个 高 优先 级 中 断 ， 它 由 监 
视 电 凶 电 量 水 平 的 电路 所 驱动 。 当 电池 几乎 已 经 丧失 其 对 计算 机 的 供电 能 力 时 ， 一 个 高 优先 
级 的 中 断 服 务 程序 将 自动 接管 并 保存 计算 机 的 状态 ， 使 得 你 能 关闭 计算 机 并 在 电 凶 充电 后 恢 
复 。 谈 到 中 断 的 至 关 重 要 性 ， 最 高 优先 级 的 中 断 机 制 通常 保留 给 对 人 员 生 命 的 保护 。 

由 于 较 高 优先 级 中 断 能 屏蔽 (mask) 来 自 较 低 优先 级 的 中 断 信 和 号， 所以， 如 果 较 高 优先 
级 的 中 断 正 在 被 服务 ， 那 么 较 低 优先 级 的 中 断 就 不 得 不 等 待 。 这 就 是 为 什么 当 你 的 PC 正 忙 于 
磁盘 驱动 时 ， 你 在 Windows 中 会 看 到 沙漏 形状 的 符号 。Windows 在 以 这 种 形式 告诉 你 ， 正 在 
读 磁盘 数据 ， 和 鼠标 正在 等 待 轮 到 自己 。 

在 很 多 情况 下 ， 尤 其 是 对 于 像 Windows 和 Linux 这 样 的 操作 系统 ， 计 算 机 和 操作 系统 用 来 
响应 中 断 的 时 间 是 不 可 预知 的 ， 也 就 有 可 能 不 是 足够 地 快 ， 不 能 保证 在 分 配 的 时 间 内 可 靠 地 
服务 所 有 的 中 断 。 为 了 使 基于 计算 机 的 系统 在 处 理 外 部 事件 时 工作 可 靠 ， 一 种 不 同类 型 的 操 
作 系统 被 设计 出 来 。 能 够 处 理 以 外 部 的 时 间 帧 发 生 的 外 部 事件 的 操作 系统 被 称 为 实时 操作 系 
统 (real-time operating system, RTOS)。 与 Windows 不 同 ，RTOS 不 是 一 个 平等 主义 的 操作 系 
统 。 个 人 PC 上 的 操作 系统 是 以 循环 的 方式 对 任务 进行 调度 的 ， 每 个 被 执行 的 任务 都 能 从 操作 
系统 (通常 简 写 为 O/S) 那里 得 到 一 个 时 间 片 ， 这 与 该 任务 有 多 么 “重要 ”无 关 。 有 时 ，O/S 
会 在 医 后 给 在 进行 输入 和 输出 的 任务 更 多 的 时 间 。 然 而 ， 关 键 是 我 们 无 法 准确 地 预测 ， 在 所 
有 条 件 下 ， 是 否 所 有 的 任务 都 能 以 其 重要 程度 的 次 序 来 执行 ， 而且 所 有 中 断 都 能 在 要 求 的 时 
间 间 隔 内 得 到 服务 。 当 然 ， 用 更 快速 的 计算 机 总 是 有 好 处 的 ， 但 有 时 经 济 上 的 现实 问题 更 突 
出 ， 使 得 这 成 为 不 可 行 的 选择 。 

RTOS 所 采用 的 调度 机 制 与 PC 的 O/S 截 然 不 同 。 一 个 准备 好 运行 的 较 高 优先 级 的 RTOS 任 
务 将 总 是 抢占 当前 正在 运行 的 较 低 优先 级 的 任务 。 而 且 ，O/S 的 核心 软件 都 是 谨慎 设计 的 ， 能 
使 任务 之 间 进 行 切换 所 花 的 时 间 最 小 化 。 这 就 是 为 什么 ARM 体 系 结构 具有 一 个 快速 中 断 请 求 
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模式 和 寄存 器 堆 的 原因 。 两 个 特性 都 是 对 体系 结构 的 增强 ， 用 以 加 快 处 理 器 对 苛刻 请 求 的 响 
应 时 间 ， De se 行 服 务 。 
图 12-2 是 在 RTOS 控 制 之 下 运 
的 计算 机 系统 的 行为 图 。x 轴 以 和 mt TI 
Tr 
下 度量 ， 冰 出 的 每 时间 店 度 是 
hs。y 轴 显示 出 系 rr 
和 中 上 断 。 中 断 和 任务 以 优先 级 下 降 二 二 HH 
的 顺序 排列 。 最 高 优先 级 的 中 断 fi 
1 的 仿 先 级 ， 而。 全 和 时 | 上 上 HH 二 上 直上 
Int_2 又 比 其 他 任何 任务 都 有 更 高 的 任务 6 
人 大 肥大 和 We 他 gz[ [HH 





统 处 于 空 空闲 状态 。 系统 空间 下 加 

请 注意 每 个 较 高 优先 级 的 任务 10.414 10.415 10.416 10.417 
是 如 何 抢占 较 低 优先 级 的 任务 的 ， 时 间 〈 秒 ) 
霹 诗 较 高 优先 级 的 任务 完成 或 者 在 图 12.2 一 个 典型 的 实时 操作 系统 的 中 断 和 任务 切换 用 应 图 。 


看 标记 为 任务 3 的 任务 ， 当 任务 3 开 
始 运行 时 ， 它 抢占 了 任务 5， 并 持续 运行 直至 在 大 约 时 间 =10.4155 秒 处 才 停 止 。 在 这 个 时 刻 ， 
任务 5 再 次 开始 ， 直 至 再 次 被 抢占 ， 这 次 是 被 最 高 优先 级 任务 1 所 抢占 。 

任务 1 运行 ， 但 被 mt_2 抢 占 。 当 Int_2 的 中 断 服务 程序 完成 时 ， 任 务 1 再 次 开始 ， 然 后 结束 ， 
使 得 任务 3 再 次 接管 。 当 任务 3 最 终结 束 执行 时 ， 任 务 5 就 能 开始 执行 了 了。 然而， 任务 4 突 然 活 
跃 起 来 并 抢占 了 任务 5。 最 后 ， 任 务 4 结 束 后 ， 任 务 5 就 能 完成 运行 了 。 当 任务 5 完成 时 ， 系 统 
返回 到 空闲 状态 。 

如 果 这 一 切 看 起 来 非常 复杂 就 对 了 。 甚 至 在 这 个 “相对 简单 ”的 例子 中 ， 你 也 能 发 现 潜 
在 的 问题 。 如 果 任 务 5 持 续 不 断 地 被 较 高 优先 级 的 任务 和 中 断 所 抢占 而 总 也 不 能 运行 完 怎么 办 
呢 ? 这 的 确 是 一 种 可 能 性 。 我 们 也 可 能 遇 到 某 种 事件 序列 ， 导 致 系统 锁 住 。 其 中 一 种 这 样 的 
情况 就 是 优先 级 颠倒 (priority inversion) 。 优 先 级 颠倒 发 生 的 原因 是 : 较 低 优先 级 任务 本 身 被 
抢占 ， 而 较 低 优先 级 任务 又 保留 了 对 一 种 系统 资源 的 控制 权 (比如 存储 缓冲 器 ) ， 但 较 高 优先 
级 的 任务 却 要 使 用 这 种 资源 ， 这 样 就 使 较 高 优先 级 任务 被 悬挂 而 不 能 运行 。 一 个 非常 有 趣 的 
优先 级 颠倒 问题 发 生 于 火星 探测 器 (Mars Rover) 计划 中 !， 就 是 在 探测 器 刚刚 停 在 火星 上 的 
时 候 。 在 帕 萨 迪 纳 的 任务 控制 人 员 用 一 个 在 喷气 推进 实验 室 的 实验 场 中 运行 的 相同 探测 器 进 
行 了 模拟 ， 他 们 发 现 探 测 器 的 RTOS 由 于 优先 权 址 倒 而 锁 住 了 。 最 后 他 们 得 以 纠正 了 这 个 问题 
并 将 新 代码 上 载 到 探测 器 的 基于 8086 的 计算 机 系统 中 。 

从 以 上 例子 你 已 经 看 到 ， 由 于 中 断 是 异步 的 ， 所 以 能 彼此 中 断 。 一 个 处 理 器 可 在 处 于 
中 断 服 务 程序 中 时 ， 人 允许 另 一 个 中 断 进 入 。 处 理 器 怎么 做 呢 ? 为 处 理 这 种 情况 ， 通 常 对 中 
断 进 行 优 先 权 化 。 一 个 更 重要 ( 较 高 优先 权 ) 的 中 断 可 以 总 是 抢占 一 个 较 低 优先 权 的 中 断 ， 
就 像 一 个 较 高 优先 级 的 任务 可 以 抢占 一 个 较 低 优先 级 的 任务 一 样 。 高 优先 级 中 断 和 低 优 先 
级 中 断 都 有 哪些 例子 呢 ? 如 果 一 个 较 高 优先 级 的 中 断 正 在 被 服务 ， 则 较 低 优先 级 的 中 断 就 
得 等 待 ， 因 为 较 高 优先 级 的 中 断 能 屏蔽 来 自 较 低 优先 级 中 断 的 信和 号。 回忆 可 知 ，ARM 处 理 
器 设 有 优先 级 化 的 中 断 ， 两 个 中 断 FIR 和 IRQ 有 相同 优先 级 ， 它 们 车 在 PSR 中 被 允许 ， 就 可 
以 总 有 效 。 
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然而 ， 在 大 多 数 计算 机 中 总 是 有 一 个 最 高 优先 级 的 中 断 。 这 是 一 种 不 能 被 忽视 的 ， 必 须 
总 是 立即 得 到 服务 的 中 断 ， 这 就 是 不 可 屏蔽 中 断 (nonmaskable interrupt, NMI) 。 一 般 来 说 ， 
我 们 将 NMI 保 留 给 灾难 性 事件 ， 如 系统 供电 停止 、 检 测 到 存储 器 失效 等 。 在 飞机 上 ，NMI 可 
能 保留 给 即将 发 生 的 有 生命 威胁 的 情况 。 从 一 旦 被 服务 完 就 返回 到 你 代码 中 首次 发 生 中 断 的 
那 一 点 的 意义 上 说 ，NMI 是 一 个 真正 的 中 断 。 

余下 的 中 断 是 优先 权 化 的 ， 可 通过 各 种 外 部 和 内 部 方法 对 其 赋予 优先 级 别 。 我 们 在 本 
课本 中 不 关心 这 是 如 何 实现 的 ， 只 是 要 了 解 如 果 较 高 优先 级 的 中 断 正 在 被 服务 ， 则 较 低 优 
先 级 中 断 就 必须 要 等 待 。 在 Motorola 68K 体 系 结构 中 ， 最 低 优先 级 中 斯 就 是 优先 级 -1 中 断 ， 
NMI 中 断 是 优先 级 -7 中 断 。 当 一 个 中 断 正在 被 服务 时 ， 只 有 上 共有 较 高 优先 级 别 的 中 断 才 能 
接管 控制 。 还 要 注意 ， 我 们 不 对 不 可 屏 项 中 断 赋 予 优先 级 别 ， 因 为 它 是 硬 连 线 到 处 理 器 的 
状态 机 中 的 。 


12.3 异常 


异常 与 中 断 相 似 ,但 异常 是 由 与 程序 相关 的 事件 生成 的 ， 如 存储 器 访问 错误 (那里 没有 
存储 器 )、 非 法 指令 (指针 错误 )、 用 零 除 错误 或 者 其 他 需要 特殊 处 理 的 程序 故障 。 从 结构 的 
角度 看 ， 除 了 不 能 被 屏 藏 以 外 ， 可 以 像 处 理 中 断 一 样 处 理 它们 。 如 果 有 异常 生成 的 情况 发 生 ， 
异常 处 理 过 程 立即 开始 。 


12.4 Motorola 68K 的 中 断 


Motorola 68K 处 理 中 断 的 方式 十 分 标准 ， 所 以 我 们 将 采用 这 种 体系 结构 作为 原型 并 花 一 
些 时 间 来 讨论 它 。 在 68K 处 理 器 的 地 址 空间 中 ， 前 1024 个 字 节 的 存储 器 是 保留 的 ， 用 于 处 理 
异常 和 中 断 。 因 此 ， 从 0x000000 到 0x0003FF 之 间 的 字 节 地 址 就 是 为 处 理 中 断 和 异常 保留 的 ，. 
用 户 程序 不 应 该 从 地 址 0x000400 以 下 开始 。 我 们 将 这 些 地 址 中 的 每 一 个 称 为 向 量 (vector)， 
因为 向 量 指向 了 程序 代码 ， 而 程序 代码 就 是 被 设计 用 来 服务 于 异常 的 。 换 旬 话 说 ， 与 这 些 中 
断 向 量 关 联 的 存储 器 位 置 的 内 容 本 身 就 是 地 址 ， 就 是 中 断 服务 程序 在 存储 器 中 的 地 址 。 

在 每 个 长 字 存储 器 位 置 ， 程 序 员 放 置 的 是 相应 的 中 断 服务 程序 或 异常 的 第 一 条 指令 。 例 
如 ， 一 个 不 可 屏蔽 中 断 (NMI) 的 中 断 服 务 程 序 存 于 地 址 0x00007C。 处 理 器 执行 如 下 序列 来 
响应 该 NMI; 

。 完 成 当前 指令 

。 将 状态 寄存 器 的 一 个 拷贝 在 和 人 堆栈 

。 将 下 一 条 要 执行 指令 的 地 址 存 人 堆栈 

。 切换 到 管理 模式 

。 取 出 存放 在 存储 器 位 置 0x00007C 的 32 位 数据 

。 从 存 于 0x00007C 处 的 存储 地 址 开始 执行 中 断 服务 程序 

这 种 类 型 的 寻 址 也 称 为 间接 寻 址 (indirect addressing)。 存 储 于 某 存储 器 位 置 的 数据 就 是 
实际 上 的 真实 数据 的 地 址 。 在 C 和 C++ 中 ， 我 们 称 之 为 指针 。 这 样 ， 存 储 器 的 前 256 个 长 字 就 
被 保留 为 系统 向 量 (system vector)， 这些 系统 向 量 是 指向 某 些 存 储 区 域 的 指针 ， 而 这 些 区 域 
存储 的 是 实际 的 异常 处 理 代码 或 中 断 服务 程序 。 

在 存储 器 中 的 前 两 个 长 字 地 址 90x000000 和 0x000004 有 特殊 的 重要 性 。 复 位 信号 有 效 后 ， 
68K 将 取出 在 0x000000 的 向 量 并 将 其 放 入 堆栈 指针 寄存 器 中 。 接 着 它 将 取出 位 于 0x000004 的 
向 量 并 将 其 放 入 程序 计数 器 寄存 器 (program counter register) 中 。 然 后 ， 它 将 在 程序 计数 器 
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寄存 器 中 所 存储 的 地 址 处 开始 执行 程序 。 

中 断 告诉 我 们 什么 时 候 一 个 外 部 世界 任务 需要 服务 ， 但 我 们 如 何 实际 地 与 外 部 世界 交 换 
真实 数据 呢 ? 在 与 外 部 世界 接口 中 ， 最 基本 的 任务 之 一 就 是 将 计算 机 中 的 事件 与 外 部 世界 中 
的 事件 进行 同步 。 计 算 机 中 的 事件 可 能 每 秒 几 亿 次 ， 而 外 部 世界 中 的 事件 在 几 个 小 时 时 间 都 
可 能 不 变化 。 同 步 这 两 个 时 间 尺 度 的 最 简单 方式 之 一 就 是 用 D 型 触发 器 作为 存储 寄存 器 。D 寄 
存 器 或 锁 存 器 的 典型 应 用 就 是 用 来 将 外 部 世界 事件 同步 到 处 理 器 总 线 。 当 它们 用 于 与 外 部 世 
界 接 口 时 ， 我 们 称 之 为 /0 端口 (IO port) 而 不 是 寄存 器 。 

你 已 经 看 到 Intel x86 系 列 将 LO 端口 看 作 是 独立 的 寻 址 空间 ， 而 ARM 和 68K 体 系 结构 将 I/O 
设备 看 作 是 处 理 器 存储 空间 的 一 部 分 。 因 此 ，8086 就 有 一 个 独立 的 汇编 语言 指令 ， 用 于 对 IO 
空间 进行 读 和 写 ， 而 不 是 对 存储 器 进行 读 和 写 。 有 时 ， 与 存储 器 空间 相 比 ，IO 空 间 的 时 序 没 
那么 严格 ， 地 址 译 码 也 比较 容易 。 将 MO 设备 映射 到 处 理 器 的 存储 空间 后 ， 就 产生 了 较 简单 的 
指令 集 ， 因 为 IO 传输 就 与 存储 器 传输 相同 了 。 在 这 两 种 系统 中 ， 中 断 和 状态 寄存 器 用 于 通知 
什么 时 候 数 据 可 用 。 

让 我 们 考察 一 下 一 个 简单 的 8 位 IO 端口 的 操作 ， 来 看 看 我 们 如 何 将 计算 机 和 外 部 世界 接 
口 。 图 12-3 就 是 一 个 IO 冯 口 的 简单 示意 图 。 
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图 12-3 微 处 理 器 存储 空间 内 的 IO 端口 的 总 体 观察 


IO 端口 可 以 是 单个 的 端口 ， 也 可 以 是 全 部 IO 的 连续 块 。 例 如 ， 在 你 PC 内 部 的 图 形 芯片 
可 能 有 一 百 个 或 更 多 的 IO 端口 ( 称 为 寄存 器 图 (register map)) 与 图 形 环境 的 数据 传送 和 控 
制 相 关联 。 在 图 12-3 中 ， 我 们 看 到 这 个 IO 设备 被 分 为 独立 端口 ， 端 口 是 单 个 位 、4 位 或 更 多 
位 宽 的 域 。 每 个 端口 按 其 要 执行 的 VO 功能 进行 了 配置 。 

让 我 们 考虑 如 图 12-4 所 示 的 更 特殊 的 电路 。 图 12-4 中 的 IO 端口 在 计算 机 中 呈现 出 两 个 连 
续 的 存储 器 位 置 。 实 际 形成 O 端 口 的 器 件 有 两 个 部 件 与 其 关联 。 位 于 偶数 地 址 (A0=0) 的 部 
分 是 IO 端口 本 身 ， 位 于 奇数 地 址 (A0=1) 的 部 分 决定 了 该 IO 如 何 使 用 。 对 于 大 多 数 MO 端 品 
来 说 都 有 一 个 约束 ， 即 它们 不 能 同时 既 输入 又 输出 。 我 们 必须 将 器 件 的 各 个 位 编程 为 输入 或 
者 输出 。 
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地 址 总 线 、 数 据 总 线 和 状态 总 线 








A0 = 0: D0.…D7 的 MO 数据 

A0 = 1: 数据 方向 寄存 器 

即 ， 如 果 DDR 位 0 = 0, DO = 输入 
如 果 DDR 位 0 = 1, D0 = 输出 


存储 


Do Do 不 


图 12-4 8 位 IO 端口 


地 址 译 码 模块 决定 了 IO 端口 在 处 理 器 地 址 空间 的 哪个 地 方 起 作用 。 例 如 ， 假 设 端口 分 别 
占据 着 字 节 地 址 $00A600 和 $00A601。 实 际 的 IO 端口 出 现在 偶数 地 址 ， 控 制 寄存 器 出 现在 奇 
数 地 址 ， 我 们 称 这 个 控制 寄存 器 为 数据 方向 寄存器 (data direction register, DDR ) 。 

当 我 们 向 DDR 写 入 时 ， 我 们 就 是 在 逐个 位 地 对 WO 端口 的 配置 进行 编程 。 任 何 位 的 位 置 ， 
若 被 写 人 “0”， 就 使 得 WO 端口 的 相应 位 成 为 输入 ， 反 之 车 被 写 信 “1” 就 是 输出 。 当 然 ， 使 
“1” 对 应 输入 和 使 “0” 对 应 输出 更 有 道理 ， 但 是 硬件 设计 者 就 是 这 样 一 伙 开 玩笑 的 家 伙 。 因 
此 ， 若 将 $FF 写 人 DDR 就 会 使 WO 端口 的 所 有 位 成 为 输出 位 ， 而 车 写 和 人 $00， 就 会 使 所 有 位 成 为 
输入 位 。 将 $AA 写 入 DDR 就 会 使 奇数 位 成 为 输入 而 偶数 位 成 为 输出 。 

假设 我 们 将 DDR 编 程 为 $4FF， 我 们 现在 就 有 了 一 个 8 位 的 输出 端口 。 从 计算 机 这 一 边 ， 我 
们 可 以 向 这 个 寄存 器 写 一 个 值 ， 就 好 像 它 是 任何 其 他 存储 器 位 置 一 样 ， 但 是 我 们 接着 就 会 在 
IO 端口 的 输出 一 侧 看 到 这 个 数据 。 而 且 ， 这 个 数据 是 持久 性 的 ， 如 果 不 停 止 计算 机 的 话 它 就 
能 在 端口 的 输出 一 侧 保留 数 天 。 我 们 现在 就 有 了 一 个 数字 控制 信号 ， 我 们 可 用 它 做 我 们 想 做 
的 任何 事情 。 现 在 ， 假 设 我 们 想 将 该 端口 作为 输入 端口 使 用 。 

当 外 部 数据 出 现在 端口 时 ， 该 数据 必须 在 时 钟 上 升 沿 的 作用 下 被 写 人 端口。 现在 ， 数 据 
就 被 存 入 到 了 端口 的 输入 部 分 ， 但 一 般 来 说 ， 计 算 机 无 法 得 知 数据 是 否 在 那里 或 者 存在 那里 
的 数据 是 否 已 经 改变 。 这 是 IO 端口 和 存储 器 位 置 之 间 的 一 个 微妙 的 、 非 常 重要 的 不 同 。 同 样 ， 
如 果 我 向 存储 器 写 一 个 数据 值 ， 然 后 立即 将 其 读 回 ， 我 预计 会 看 到 我 刚 写 人 的 数据 。 然 而 ， 
对 于 一 个 IO 端口 ， 我 写 和 端口 (输出 ) 的 数据 通常 不 是 我 从 端口 (输入 ) 读 来 的 数据 ， 因 为 
端口 的 输出 和 输入 部 分 是 不 同 的 。 

对 于 存储 器 ， 我 们 假设 存在 那里 的 数据 不 会 变化 ， 除 非 我 们 以 某 种 方式 改变 了 它 。 我 假 
定 你 们 都 熟知 创建 全 局 变量 的 危险 ， 即 全 局 变量 非常 容易 被 出 乎 预料 的 方式 改变 ， 程 序 员 在 
同 它们 打交道 时 要 尤其 警惕 。LIO 端 口 变量 怎么 样 呢 ? 我 们 有 同样 的 问题 ， 甚 至 更 坏 。 对 于 IO 
端口 ， 我 们 必须 假设 存储 在 端口 〈 输 入 侧 ) 的 数据 可 自发 地 变化 ， 而 且 我 们 所 习惯 遵循 的 所 
有 存储 器 完整 性 规则 可 能 再 也 不 会 有 效 了 。 

由 于 对 IO 端口 的 操作 常常 就 好 像 它 们 是 存储 器 一 样 ， 但 实际 上 IO 端口 不 是 存储 器 ， 所 以 
编译 器 就 必须 有 关于 如 何 处 理 MO 端 口 的 专用 指令 。 告 诉 编译 器 不 要 假设 一 个 存储 器 位 置 ( 变 
量 ) 是 简单 存储 器 的 一 个 最 一 般 的 方式 就 是 使 用 volatile 关 键 字 。 例 如 : 


volatile unsigned short int * foo; 


告诉 编译 器 ，foo 是 一 个 指向 正 的 16 位 存储 器 变量 的 指针 ， 该 变量 可 能 在 无 警告 的 情况 下 自发 
地 改变 值 。 这 意味 着 编译 器 不 应 对 包含 该 指针 的 代码 做 任何 优化 的 设想 。 被 指针 废弃 引用 
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(dereferenced) 的 值 不 应 被 赋值 到 寄存 器 或 进行 其 他 任何 形式 的 优化 。 这 个 指针 总 是 用 于 改 
变 存储 器 的 值 或 读 该 值 ， 仅 此 而 已 。 

作为 一 个 例子 ， 让 我 们 考虑 一 个 现实 中 的 IO 端口 。 我 们 将 要 考察 的 例子 是 一 个 通用 异步 
接收 器 /发 送 器 ， 即 UART。 你 可 能 不 太 知道 这 个 名 字 ， 因 为 很 有 可 能 你 是 通过 将 其 作为 你 PC 
上 的 一 个 囊 行 通信 阅 口 (com port) ， 如 COM1 或 COM2 而 认识 这 个 词 的 。 一 个 串 行 通信 端口 
就 是 串 行 的 发 送 和 接收 装置 。 假 设 你 的 计算 机 中 有 一 个 UART， 硬 件 设计 者 已 经 将 其 设计 成 在 
存储 地 址 $006000 处 映像 而 成 的 16 位 宽 IO 端 口 。 下 面 是 操作 规范 ; 

。 8 位 串 行 数据 (一 个 字 节 ) 被 发 送 ， 并 在 位 DB8~DB15 处 被 接收 。 

。 DB0~DB7 提 供 关 于 设备 的 状态 信息 。 

。DB0= 数 据 就 结 (DR) 状态 位 。 

。DR=1 意 味 着 数据 可 用 ， 可 从 DB8~DB15 读 取 。 

。DR=0 意 味 着 目前 没有 数据 等 待 被 读 取 。 

。DB1= 发 送 缓 冲 器 (TB) 状态 位 。 

。TB=0 意 味 着 目前 发 送 器 缓冲 区 空间， 数据 可 传送 到 其 中 以 便 发 送 。 

。TB=1 意 味 着 目前 发 送 器 缓冲 区 正在 发 送 数 据 ， 新 数据 不 应 向 其 写 入 。 

考察 以 上 规范 ， 我 们 知道 : 

。 当 DR=0 时 ， 如 果 我 们 读 DB8~DB15， 我 们 不 能 确保 数据 是 有 效 的 。 

。 当 DR=1 时 ， 如 果 我 们 读 DB8~DB15， 我 们 将 读 到 有 效 数据 ，UART 将 自动 将 DR 复位 到 0。 

。 当 TB=1 时 ， 如 果 我 们 向 DB8~DB15 写 ， 那 么 我 们 就 可 能 会 覆盖 正在 被 发 送 的 数据 ， 从 

而 破坏 这 些 数 据 。 
图 12-5 显 示 出 处 于 计算 机 内 部 的 UART。 
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串 行 数据 输出 
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串 行 数据 输入 


图 12-5 UART 设 备 的 示意 图 表示 。 在 这 个 例子 中 ，UART 从 计算 机 
向 拨号 调制 解 调 器 发 送 串 行 数据 


让 我 们 看 两 个 68K 汇 编 语言 代码 的 片段 , 这 两 个 片段 说 明了 我 们 如 何 对 UART 进 行 读 和 写 。 
注意 ， 在 这 个 例子 中 ， 我 们 将 采用 轮 询 循环 而 不 是 中 断 服 务 程序 。 这 使 得 对 位 编码 更 易于 演 
示 ， 虽 然 你 立即 就 会 看 到 这 是 多 么 的 低 效 。 一 个 典型 的 用 于 拨号 连接 的 50K 波 特 (bps) 的 调 
制 解 调 器 每 秒 发 送 和 接收 的 字符 大 约 为 5000 个 。 我 是 怎么 知道 这 一 点 的 呢 ? 波 特 (BAUT) 
是 电话 业 中 每 秒 位 数 的 行 话 。 在 这 个 传输 限制 下 ， 需 要 10 位 来 传输 8 位 字符 ， 所 以 50K 波 特 的 
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真实 情况 是 每 秒 5000 字 节 的 实际 数据 流 。 

如 果 我 的 计算 机 正 以 1GHz 的 时 钟 速率 运行 ， 则 在 UART 发 送 一 个 字符 的 时 间 里 ， 就 发 生 了 
200 000 个 计算 机 时 钟 脉冲 。 如 果 计 算 机 能 平均 大 约 每 两 个 时 钟 脉冲 执行 一 条 指令 ， 则 在 它 等 待 
UART 发 送 一 个 字符 期 间 就 应 该 能 执行 大 约 100 000 条 指令 。 至 少 通过 中 断 ， 它 可 在 等 待 时 做 一 些 
其 他 事情 。 但 是 ， 由 于 采用 轮 询 循环 ， 它 就 要 围绕 这 个 循环 运行 几 万 次 来 等 待 UART 结 束 。 鹃 …… 

* 一 个 用 于 测试 串 行 数据 准备 好 被 读 的 短程 序 


START LEA $00006000,A5 | * 装 入 地 址 
LOOP1 MOVE.W (A5),DO -= * 得 到 UART 的 状态 
ANDI.W  #$000f,D0 二 测试 DR 
“BEQ LOOP1 * 保持 等 待 
* 一 个 用 于 看 数据 是 否 可 被 发 送 的 短程 序 
START LEA $00006000,A5 * 装 入 地 址 
LOOP2 MOVE.W (AS5),DO 2 * 得 到 UART 状 态 
ANDI.W  #$0002,D0 i 
BNE LOOP2 x 保持 等 待 ” 


我 们 一 直 在 拘泥 于 用 汇编 语言 来 阐明 计算 机 体系 结构 的 各 个 方面 。 然 而 ， 大 多 数 程序 员 
是 用 高 级 语言 编程 的 ， 所 以 ， 人 们 自然 会 问 到 C++ 程序 员 如 何 处 理由 IO 端口 所 施加 的 硬件 限 
制 。 记 住 ，IO 端 口 处 在 存储 器 中 的 固定 地 址 。C++ 编 译 器 通常 希望 能 够 管理 存储 变量 的 空间 
分 配 (或 者 调用 操作 系统 作为 协助 ) ， 因 此 ， 为 了 将 变量 分 配 到 特定 的 存储 地 址 ， 我 们 就 不 得 
不 降服 编译 器 。 

让 我 们 看 一 个 具有 相同 汇编 代码 的 例子 ， 但 这 次 用 的 是 C++ 语言 。 


char *p_status; // 指向 状态 端口 的 指针 
char *p_data;  // 指向 数据 端口 的 指针 


p_status = (char*) 0x6001; // 将 指针 分 配给 状态 端口 
pdata = (char*) 0x6000; // 将 指针 分 配给 数据 端口 
do { } while (( *p_status & 0x01) == 0 ); // 等 待 
char inData = *p_data; 


为 了 将 指针 分 配 到 IO 设备 地 址 ， 我 们 必须 明确 地 将 指针 强制 转换 (cast) 到 0x6000 和 
0x6001。 在 C++ 用 于 嵌入 式 系统 编程 时 ， 这 种 对 硬件 进行 寻 址 的 方法 相当 典型 。 


12.5 模 数 (A/D) 转换 和 数 模 (D/A) 转换 


外 部 世界 是 一 个 模拟 世界 。 这 是 什么 意思 呢 ? 这 个 意思 就 是 外 部 世界 中 发 生 的 物理 事件 可 
能 呈现 无 限 个 可 能 的 值 。 风 速 、 户 外 温度 、 阳 光 强 度 都 是 可 以 在 某 个 取 值 范围 内 光滑 地 、 无 
限 地 进行 变化 的 物理 量 。 例 如 ， 在 地 球 上 ， 户 外 温度 可 能 在 冬季 南极 点 的 -100 华 氏 度 到 夏季 
中 午 死 亡 峡 谷 的 +140 华 氏 度 之 间 的 范围 变化 。 虽 然 我 们 通常 以 整数 度数 来 报告 温度 ， 但 没有 
什么 能 阻止 采用 72.56435791 度 这 样 的 精度 。 问 题 是 我 们 如 何 精确 、 快 速 、 低 成 本 地 测量 温度 。 

为 了 测量 这 些 物理 量 ， 我 们 首先 需要 一 个 电路 或 装置 来 提供 该 物理 量 的 一 个 电气 上 的 
“类 似 物 ”。 模 拟 电子 学 正 是 可 用 来 代表 平滑 变化 的 电信 号 的 电路 ， 该 电信 号 就 是 物理 量 的 类 
比 物 。 例 如 ， 我 可 能 想 控制 炉子 内 部 的 温度 。 为 了 精确 地 保持 一 个 固定 的 温度 或 者 温度 随时 
间 变 化 的 轮廓 ， 我 首先 需要 能 测量 炉 内 温度 。 一 般 是 用 热电 偶 或 铂 电阻 温度 计 (PRT) 来 测 
量 炉 内 温度 。 然 后 ， 其 他 电路 将 测量 的 温度 作为 输入 信号 ， 将 对 火炉 功率 进行 控制 的 驱动 作 
为 输出 信号 。 
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PRT 有 一 个 电阻 值 的 范围 ， 这 个 电阻 值 可 从 房间 温度 中 的 100 欧 姆 到 800 华 氏 度 中 的 2000 
欧姆 之 间 平 请 地 变化 。 我 们 可 以 说 PRT 有 一 个 每 度 2.6 欧 姆 的 传递 函数 (transfer function)。 重 
要 的 一 点 是 ， 对 于 温度 这 个 平滑 变化 的 物理 量 ， 模 拟 电 子 装置 能 给 出 平滑 变化 的 电信 号 ， 这 
是 模拟 电子 学 的 精米 。 虽 然 不 是 所 有 时 间 ， 但 大 多 数 时 间 我 们 想 将 物理 量 转换 为 模拟 电压 。 
这 也 许 要 采取 几 个 步骤 ， 因 为 我 们 使 用 的 传感器 可 能 首先 将 物理 信和 号 转换 为 电流 或 电阻 。 而 
且 ， 这 些 信 号 的 量 值 可 能 过 小 ， 不 使 用 某 种 放大 器 就 测量 不 了 。 

计算 机 是 一 个 数字 装置 ， 它 能 处 理 被 称 为 位 的 以 离散 量 表 示 的 数字 。 一 个 8 位 的 数字 能 给 
出 从 0~255 或 者 从 一 128~+127 的 范围 ， 一 个 16 位 的 数字 能 给 出 从 0~65 535 或 者 从 一 32 768~32 767 
的 范围 ， 依 此 类 推 。 这 样 ， 问 题 就 变 为 :“ 我 们 如 何 从 一 个 模拟 值 转换 到 与 其 等 价 的 数字 值 ， 又 
如 何 从 一 个 数字 值 转换 到 与 其 等 价 的 模拟 值 ? ”前 一 个 过 程 称 为 模拟 到 数字 转换 (analog-to- 
digital conversion) ， 即 AD 转换 ， 后 一 个 过 程 称 为 数字 到 模拟 转换 (digital-to-analog 
conversion) ， 即 D/A 转 换 。 

在 你 的 计算 机 中 就 有 A/D 转 换 器 和 D/A 转 换 器 。 它 们 在 哪里 ? 你 的 声卡 能 将 声音 数字 化 
(A/D) 并 将 其 存 为 *.wav 文 件 ， 你 可 以 通过 扬声器 播放 这 个 *.wav 文 件 (D/A)。 输 出 到 监视 器 
的 视频 由 快速 变化 的 模拟 电压 组 成 ， 这 些 电 压 驱 动 监 视 器 内 部 的 红 、 蓝 、 绿 发 射 “ 枪 ”。 下 面 
是 一 些 我 们 转换 成 电压 的 物理 量 的 例子 : 

。 热电 偶 : 温度 的 度量 

。 电阻 温度 计 : 温度 的 定义 

。 应 变 仪 ， 对 位 移 或 压力 的 度量 

。 麦克 风 :; 声音 级 别 的 度量 

。 磁性 拾 音 器 : 对 磁盘 数据 的 度量 

。 光 电池 : 对 光 强 度 的 度量 

如 你 所 想 ， 我 们 越 想 要 精确 地 度量 模拟 电压 ， 就 越 要 消耗 更 多 的 时 间 和 费用 。 这 样 ， 当 
谈论 A/D 转 换 上 时， 我 们 倾向 于 将 注意 力 集中 在 做 模拟 到 数字 转换 的 分 辨 率 和 速度 上 。 一 个 有 
12 位 分 辩 率 的 A/D 转 换 器 可 能 需要 10us 将 一 个 模拟 信号 转换 成 数字 表示 。 这 意味 着 什么 呢 ? 
假设 我 们 有 兴趣 要 测量 的 物理 量 可 转换 成 一 个 从 0V 到 10V 之 间 的 模拟 电压 ，0V 是 物理 量 能 度 
量 到 的 最 低 可 能 值 ，10V 是 我 们 可 用 来 度量 这 个 物理 量 的 最 高 电压 。 注 意 这 和 覆盖 了 一 个 范围 的 
值 。 因 此 ， 假设 要 测量 的 物理 量 是 温度 ， 我 们 的 模拟 电路 就 可 做 如 下 设计 : 

1. 如 果 低 于 100 华 氏 度 ， 则 模拟 电压 是 0V。 

2. 如 果 温 度 在 100 到 500 华 氏 度 之 间 ， 则 模拟 电压 随 温度 在 0V 到 10V 之 间 线 性 变化 。 这 时 
的 传递 函数 是 每 伏 40 度 。 

3. 对 于 超过 500 华 氏 度 的 所 有 温度 ， 模 拟 电 压 保持 在 10V。 

现在 ， 我 们 的 12 位 转换 器 有 从 0~4095 的 2 个 可 能 值 ， 所 以 10V 的 模拟 值 范围 可 划分 成 
4095 个 片段 。 数 字 信 和 号 的 每 个 递增 就 代表 10/4095 的 变化 ， 约 2.44 x 10-3 伏 /位 。 这 样 ， 在 我 们 
注意 到 温度 变化 之 前 ， 温 度 可 能 就 变化 了 (40 度 / 伏 ) x (2.44 x 10 * 伏 /位 ) ， 即 大 约 0.01 度 。 

如 果 我 们 采用 的 是 一 个 8 位 A/D， 那 么 在 我 们 能 察觉 任何 变化 之 前 ， 温 度 可 能 已 变化 了 1.5 
度 。 这 样 ，A/D 转 换 器 的 分 辩 率 就 是 数字 输出 的 位 数 和 代表 输入 跨度 的 模拟 电压 范围 的 函数 。 

作为 讨论 外 部 接口 的 切 和 人 点 ， 让 我 们 做 一 个 外 部 情况 的 实例 研究 :。 这 个 实例 恰好 是 我 在 
2000 年 变更 期 间 经 历 的 。 虽 然 只 有 一 些 孤 立 的 2000 年 问题 实际 地 发 生 了 ， 但 这 并 不 意味 着 
2000 年 问题 未 曾 真实 存在 过 。 事 实 上 ， 这 个 问题 及 其 潜在 的 具有 生命 威胁 的 故障 ， 都 确实 是 
真实 的 。 
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我 们 将 要 研究 的 情况 是 一 个 核电 站 的 监视 和 控制 系统 的 一 部 分 。 这 个 核电 站 的 2000 年 程 
序 管理 小 组 仔细 查看 他 们 的 计算 机 系统 ， 在 系统 中 寻找 潜在 的 与 2000 年 相关 的 弱点 。 假 设 我 
们 作为 高 薪 雇 用 的 顾问 ， 被 要 求 帮助 他 们 确定 其 系统 是 否 存在 2000 年 问题 。 我 们 将 会 做 一 个 
分 析 ， 并 向 2000 年 程序 经 理 及 其 小 组 做 一 个 报告 。 

图 12-6 是 这 个 报告 中 最 重要 的 一 张 幻 灯 片 ， 让 我 们 看 一 下 。 从 图 12-6 中 ， 我 们 看 到 数据 集 
中 器 是 一 个 媒 入 式 计算 机 系统 ， 用 来 监视 大 量 的 遥感 设备 (大 约 256 个 ) ， 然 后 定期 地 用 这 些 
遥感 传感器 的 状态 来 更 新 中 央 计 算 机 系统 。 它 是 通过 一 个 RS-232 数 据 回路 发 送 一 个 ASCII 字 
符 流 来 做 到 这 些 的 。 

管道 部 分 


数据 集中 器 
信号 调节 和 一 流传 感 器 r-------------- 
/发 i 2 1 
Stop: gpm How = 100 ohms dn 一 一 图 一 一 
送 器 | 





00 gpm = 10,000 ohms 
Step 2: 100 ohms = 4ma 


10,000 ohms = 20ma 

Step 3:4 ne 0VDC 

20 ma=5VDC 

Step 4:0 VDE= 00000000 
2.5 = 10000000 
5VDC=11111111 


_data 
if FLOW_RATE <= OTHER 
then OUTPUT_PORT = 


else SEND 上 LOW _ RATE 
Step 6:0 =.0 VDC i 
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图 12-6 核电 站 的 一 个 水 冷却 管道 中 的 数据 集中 系统 的 示意 图 。 粗 体 字符 是 
局 部 数据 集中 器 向 核电 站 中 心计 算 机 发 送 的 串 行 数据 流 


我 们 感 兴趣 的 那个 特殊 的 传感器 位 于 图 的 顶部 。 我 们 想 监 视 管道 中 水 流 的 速率 。 水 的 作 
用 是 保持 反应 堆 冷却 。 如 果 水 停止 在 管道 中 流动 ， 我 们 就 想 关 闭 反 应 堆 ， 并 在 对 人 员 生 命 产 
生 任何 损害 和 威胁 前 对 员工 发 出 警告 。 

让 我 们 就 好 像 在 核电 站 中 一 样 实际 地 进行 一 下 这 个 过 程 : 

1. 位 于 水 管 中 的 一 个 传感器 测量 管道 中 的 水 流速 率 。 传 感 器 的 传递 函数 将 管道 中 的 水 压 
转换 成 电阻 。 对 于 这 个 传感器 ， 我 们 已 经 知道 传感器 中 100 欧 姆 的 电阻 意味 着 管道 中 没有 水 在 
流动 ，10 000 欧 姆 的 电阻 意味 着 水 的 流速 是 每 分 钟 100 加 仑 (G/M)。 传 感 器 的 电阻 在 100 欧 姆 
和 10 000 欧 姆 之 间 呈 线性 变化 。 我 们 可 以 将 流速 表示 成 传感器 电阻 的 方程 : 

流速 (G/M) = 0.01 (电阻 ) 一 1 

2. 由 于 传感器 位 于 距 数据 集中 器 几 百 米 以 外 的 地 方 ， 所 以 有 必要 将 电阻 值 转换 成 电流 值 。 
确切 的 原因 是 电气 工程 师 保密 誓言 的 一 部 分 ， 所 以 我 不 能 说 ， 只 要 相信 我 说 的 就 行 了 。 在 工 
业 环境 中 一 个 标准 的 传输 方法 就 是 用 4~20mA 的 电流 环 ， 这 意味 着 我 们 可 采用 从 4mA 的 低 值 到 
20mA 的 高 值 之 间 的 任何 电流 值 。 这 个 转换 是 由 位 于 传感器 附近 的 信号 调节 器 /发 送 器 来 完成 
的 。4~20mA 发 送 器 用 另 一 个 传递 函数 转换 电阻 : 

100 欧 姆 电阻 一 4mA 
10 000 欧 姆 电阻 一 20mA 
3. 在 数据 集中 器 中 ， 来 自 水 管 的 信号 被 接收 为 4~20mA 的 电流 环 ， 并 再 一 次 经 过 转换 过 程 
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成 为 另 一 个 信号 调节 器 /接收 器 中 的 电压 。 现 在 ， 转 换 函 数 就 是 ， 
4mA 一 0V 
20mA 一 SV 

所 以 ， 经 过 3 个 转换 过 程 ， 我 们 就 能 说 ， 数 据 集 中 器 的 0V 意 味 着 没有 水 流 ，5V 意 味 着 每 
分 钟 100 加 仑 的 水 流 。 

4. 在 数据 集中 器 内 部 是 一 个 具有 8 位 分 辩 率 的 模拟 到 数字 的 转换 器 。 这 意味 着 我 们 有 256 
个 单独 的 数字 码 ， 从 $00 到 $FF， 用 来 表示 0V 到 5V 范 围 内 无 限 多 个 可 能 取 值 的 模拟 电压 。 这 意 
味 着 什么 呢 ? 假设 模拟 电压 是 0V， 很 显然 数字 码 应 该 是 $00。 现在 ， 让 我 们 缓慢 地 提高 模拟 
电压 ， 什 么 时 候 数字 码 会 从 $00 跳 转 到 $01 呢 ? 这 几乎 不 可 能 严格 地 给 出 答案 ， 但 是 如 果 将 5SV 
的 模拟 电压 范围 用 可 能 的 数字 范围 来 进行 划分 ， 我 们 就 会 得 到 一 些 要 领 。 这 样 ， 每 个 数字 范 
围 就 是 5V/255=0.0196V， 所 以 ， 我 们 就 应 该 能 很 粗略 地 预计 ， 当 模拟 电压 上 升 到 大 约 0.020V 
左右 时 ，A/D 的 输出 将 变 为 $801。 这 样 ， 我 们 就 在 A/D 转 换 过 程 中 有 了 大 约 0.020V 这 样 的 不 确 
定性 ， 这 也 导致 在 管道 实际 流速 上 的 不 确定 性 。 想 要 更 精确 些 吗 ?就 要 使 用 有 更 多 位 分 辩 率 
的 A/D 转 换 器 。 我 们 还 知道 2.5V 应 该 给 出 $880 的 A/D 码 。 

5. 现在 我 们 就 准备 好 使 用 计算 机 了 。 计 算 机 读 A/D 转 换 器 的 输出 。 如 果 数 字 码 是 $0F 或 更 
低 ， 我 们 就 有 了 严重 的 问题 ， 因 此 转 到 步 双 6， 否则 转 到 步骤 8， 因 为 如 果 该 值 大 于 $OF， 就 不 
”6. 数据 集中 器 有 一 个 输出 端口 ， 该 端口 能 发 送信 号 给 警报 器 。 向 输出 端口 发 送 一 个 数字 0 
或 1 将 分 别 置 端口 的 输出 于 0V 或 5SV， 这 就 成 为 警报 器 的 一 个 输入 。 

7. 在 警报 器 上 一 个 5SV 的 输入 电压 会 打开 警报 器 ， 警 报 器 发 出 声音 报警 ， 核电 站 将 立即 进 
入 紧急 关闭 模式 。 

8. 数据 集中 器 将 A/D 转 换 器 的 输出 转换 成 流速 率 ， 并 与 一 些 辨识 信息 捆绑 起 来 ， 打 上 时 间 
印 戳 ， 然 后 继续 发 送 到 控制 室 的 计算 机 。 来 自 集中 器 的 数据 流 像 这 样 : 
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这 个 消息 解释 如 下 : 

1. 这 是 数据 集中 器 7A3 在 报告 。 

2. $$ 是 域 定 界 符 。 

3. 日 期 是 1998 年 8 月 24 日 。 

4. 时 间 是 14 点 56 分 29 秒 。 

5. 在 通道 1 读 到 的 值 是 78 加 仓 / 分 。 

6. CR ( 回 车 ) 是 消息 定 界 符 的 结尾 。 

2000 年 问题 在 哪儿 ? 请 看 第 3 个 域 值 ， 这 个 日 期 被 表示 成 了 两 位 数字 ， 它 应 该 被 解释 成 
1998? 还 是 2098 呢 ?我 们 说 不 清楚 ， 但 部 件 7A3 在 其 数据 流 中 引入 了 含糊 性 ， 所 以 对 这 种 含 
糊 性 必须 做 进一步 的 研究 。 陈 述 结束 ， 我 们 将 这 个 清单 送 到 哪儿 ? 

让 我 们 再 回 到 A/D 转 换 。 现 今 使 用 的 典型 的 A/D 转 换 方法 有 : 

。 快 内 转换 

。 逐步 逼近 

*， 单 斜率 

。 双 斜率 

。 电压 到 频率 

快 闪 转换 是 最 快 、 最 昂贵 和 最 不 精确 的 ， 只 有 6 到 12 位 的 分 辩 率 。 逐 步 逼 近 是 成 本 、 精 确 
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度 和 速度 的 最 佳 平衡 ， 在 商业 设备 中 可 达到 从 12 位 到 20 位 中 的 任何 一 个 分 辩 率 。 单 斜率 是 类 
型 最 简单 的 A/D， 具 有 12 位 到 14 位 的 适度 分 辩 率 。 双 和 斜率 (和 三 斜率 ) 最 精确 ， 具 有 22 位 到 
24 位 的 分 辩 率 。 电 压 到 频率 转换 ( 即 V/F) 是 最 慢 的 ， 但 比 其 他 方法 好 的 地 方 是 ， 具 有 平均 掉 
信号 中 噪声 的 能 力 。 

由 于 A/D 和 D/A 的 电路 设计 通常 是 电气 工程 师 的 职责 ， 所 以 我 们 在 这 里 就 不 得 不 谨慎 ， 不 
要 厚 着 脸皮 去 刺激 这 些 警 惕 性 很 强 的 人 。 我 们 要 采取 妥协 的 立场 ， 使 得 你 能 够 与 电气 工程 师 
谈论 有 关 你 计算 机 系统 中 的 A/D 转 换 问题 ， 但 你 不 要 知道 得 过 多 以 威胁 他 们 工作 的 安全 。 

我 们 需要 通过 学 习 被 称 为 比较 器 (comparator) 的 一 种 重要 电路 元 件 来 开始 我 们 对 A/D 和 
D/A 转换 的 学 习 。 比 较 器 存在 于 模拟 和 数字 之 间 的 下 层 世 界 中 ， 其 输入 是 模拟 信号 ， 输 出 是 数 
字 信 号 。 见 图 12-7 所 示 的 电路 。 

该 电路 有 两 个 输入 (一 个 十 输入 和 一 个 一 输 
入 ) 和 一 个 输出 。 输 入 接受 某 个 范围 值 的 模拟 电 vi 
压 。 假 设 输入 电压 的 范围 是 从 一 10V 到 +10V， 
即 士 10V。 任 何 从 一 10V 到 +10V 的 模拟 电压 都 ” v2 
可 施加 于 十 输入 或 者 -输入 端 而 不 会 对 电路 造 pe 
成 任何 损害 。 、 

在 -10V 到 +10V 这 个 范围 ， 如 果 在 十 输入 I 

(V1) 的 电压 比 在 -输入 (V2) 的 电压 更 正 (more positive) ， 则 比较 器 的 数字 输出 就 是 真 (1)。 
如 果 一 输入 的 电压 比 + 输 入 的 电压 更 正 ， 则 输出 为 假 (0) 。 图 12-8 对 这 个 行为 做 了 图 示 。 假 
设 在 图 12-8 中 ， 标 为 “比较 器 阔 值 电压 ”的 灰 线 被 连接 到 一 输入 (V2) ， 该 输入 保持 0V 的 稳 
定 值 。 进 一 步 ， 假 设 一 个 具有 正 负 峰 值 圭 5V 的 正弦 波 电压 被 连接 到 比较 器 的 十 输入 (Y1)s 





Out=1ifV1> V2 


比较 器 六 值 电压 


压 潍 属 涪 器 淋 开 有 闲 攻 





© 


时 间 
图 12-8 图 12-7 中 模拟 比较 器 的 传递 函数 


每 次 正弦 波 上 升 到 参考 电压 (0V) 以 上 时 ， 比 较 器 输出 就 上 升 到 1。 每 次 其 下 降 到 参考 电压 
以 下 ， 输 出 就 变 为 0。 从 某 种 观点 看 ， 比 较 器 就 是 一 个 1 位 A/D 转 换 器 。 我 们 知道 未 知 电压 是 大 于 
还 是 小 于 参考 电压 ， 但 这 就 是 我 们 知道 的 一 切 。 实 质 上 ， 比 较 器 回答 的 是 下 面 的 逻辑 问题 : 

输入 V1 处 的 电压 比 输入 V2 处 的 电压 更 正 (more positive) ， 是 真 还 是 假 ? 

让 我 们 稍微 增加 一 点 复杂 性 。 现 在 假设 正弦 波 电压 在 最 小 值 0V 和 最 大 值 4Y (Vmax) 之 
间 变 化 。 现 在 ， 让 我 们 取 来 3 个 比较 器 ， 将 它们 标记 为 A、B 和 C。 我 们 将 所 有 比较 器 的 十 输入 
连接 到 正 驼 波 电 压 ， 对 每 个 比较 器 的 一 输入 做 如 下 连接 : 

1. 比较 器 A 连接 到 Vmax 的 75%， 即 3V。 

2. 比较 器 B 连 接 到 Vmax 的 50%， 即 2V。 
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3. 比较 器 C 连 接 到 Vmax 的 25%， 即 1V。 

现在 考虑 图 12-9 的 输出 。 如 你 所 见 ， 相 同 的 未 知 电压 同时 施加 到 了 3 个 相同 比较 器 的 所 有 
+ 输入 ， 然 而 ， 每 个 -输入 连接 的 是 等 间隔 的 不 同 参考 电压 。 这 个 电路 告诉 了 我 们 更 多 东西 ， 
但 仍 很 粗糙 。 例 如 ， 如 果 比 较 器 A 的 输出 是 1， 则 我 们 知道 模拟 电压 大 于 3V， 但 小 于 正弦 波 的 
最 大 值 4V。 如 果 比 较 器 B 的 输出 是 1， 但 比较 器 A 是 0， 则 电压 大 于 2V， 小 于 3V。 


未 知 电压 输入 “ 


V MAX 











2333221000002333321000091 


图 12-9 2 位 模拟 到 数字 转换 器 。 模 拟 输 入 电压 是 通过 具有 输出 1 的 最 正 
(most positive) 的 比较 器 给 出 的 ， 而 不 是 提供 二 进 制 码 


在 图 12-9 的 底部 ， 我 们 可 看 到 表示 模拟 电压 瞬时 值 的 数字 码 。 你 会 看 到 ， 随 着 我 们 加 入 
越 来 越 多 的 比较 器 ， 将 会 发 生 什么 情况 。 事 实 上 ， 这 正 是 我 们 将 要 做 的 。 用 3 个 比较 器 ， 我 们 
能 通过 将 其 划分 为 4 部 分 从 而 “数字 化 ”未 知 的 电压 ; 

。 小 于 1V 

。 在 1V 和 2V 之 间 

* 在 2V 和 3V 之 间 

。 大 于 3V 

如 果 有 更 多 的 比较 器 ， 我 们 就 能 分 成 更 多 的 部 分 ， 有 更 好 的 精确 度 。 无 论 如 何 ， 你 开始 
明白 这 个 问题 了 ， 这 是 一 个 二 进 制 方面 的 进展 。 用 15 个 比较 器 ， 我 们 就 能 得 到 16 个 范围 ， 但 
这 只 是 4 位 的 分 辨 率 。 为 了 得 到 8 位 的 分 辩 率 ， 我 们 将 需要 255 个 比较 器 和 附加 电路 来 将 这 一 系 
列 的 比较 器 阶梯 转换 成 数字 码 。 但 等 一 下 ， 还 有 更 多 要 考虑 的 。 我 们 还 必须 以 某 种 方式 为 每 
个 比较 器 提供 适当 的 阔 值 电压 值 。 这 意味 着 我 们 需要 能 产生 255 个 不 同 的 模拟 阔 值 电压 ， 每 个 
比较 器 一 个 。 由 于 这 部 分 问题 的 解决 方法 非常 有 趣 ， 所 以 我 们 需要 暂时 岔 开 思路 再 来 处 理 它 。 

冒 着 招致 电气 工程 师 联盟 愤怒 的 危险 ， 我 们 将 学 习 电 子 工程 的 基本 方程 。 严格 地 说 ， 这 
是 额外 的 学 习 材料 。 我 们 可 按 需要 学 习 关于 计算 机 体系 结构 的 知识 而 不 用 学 习 欧 姆 定律 
(Ohm’s Law)， 但 这 个 定律 是 应 该 学 习 的 一 个 很 好 的 方程 ， 即使 你 永远 不 会 从 职业 角度 来 使 
用 它 。 而 且 ， 它 还 有 助 于 我 们 理解 将 要 遇 到 的 一 些 电路 ， 所 以 ， 赁 此 理由 就 应 该 学 习 这 个 定 
律 。 欧 姆 定律 通过 一 个 简单 的 方程 将 电流 、 电 压 及 电阻 联系 在 一 起 。 

欧姆 定律 是 说 ， 穿 过 一 个 电路 元 件 的 电压 V 等 于 通过 该 电路 元 件 的 电流 I 乘 以 电路 元 件 的 
电阻 R。 简 单 地 说 : 








280 菇 12 音 


V=IxR 


用 计量 单位 的 话说 ， 电 压 (用 伏特 度量 ) 等 于 电流 (用 安培 度量 ) 乘 以 电阻 (用 欧姆 度量 )。 
这 样 ，1 安 培 电流 流 过 1 欧姆 电阻 (R=1Q) 将 在 该 电阻 上 产生 1V 的 电压 。 另 一 个 常见 的 例子 
是 : 你 房间 中 的 灯泡 连接 到 120V 交 流 线 。 如 果 有 1 安培 电流 流 过 灯泡 ， 其 电阻 就 是 120 欧 姆 。 

值 的 典型 范围 是 : 

。 电 压 : 1mV 到 1kV， 即 10-3V 到 103V 

。 电 流 : 1RA 到 10A， 即 10 -安培 到 10 安 培 

。 电阻: 19 到 1M2， 即 1 欧姆 到 10* 欧 姆 

在 我 们 继续 学 习 并 使 用 欧姆 定律 之 前 ， 让 我 们 考虑 一 下 其 含意 。 一 个 恰当 的 类 比 是 : 一 
个 公园 的 软 管 连接 到 野外 的 龙头 上 。 假 设 我 们 处 理 的 是 水 压 而 不 是 电压 ， 流 经 软 管 的 是 水 量 
而 不 是 电流 。 此 外 ,假设 我 们 有 一 捆 不 同 直 径 和 长 度 的 软 管 备用 ， 从 内 径 1/8" 的 微小 软 管 到 有 
4" 口 径 的 软 管 (灭火 水 龙 管 )， 长 度 从 几 英 尺 到 几 百 英尺 。 

假设 我 们 在 龙头 处 有 很 大 的 水 压 (高 电压 )。 对 于 多 数 软 管 来 说 ,水量 (电流) 都 很 充足 ， 
所 以 软 管 的 阻力 不 是 很 大 。 然 而 ， 如 果 我 们 使 用 具有 最 小 直径 的 最 长 的 软 管 ， 则 在 软 管 末端 
流出 的 就 仅仅 是 一 个 滴 流 。 

现在 ,假设 水 压 ( 低 电压 ) 低 。 即 使 用 一 个 短 粗 的 软 管 ( 低 电 阻 )， 得 到 的 水 流 也 仍然 很 小 。 
这 就 是 实际 在 起 作用 的 欧姆 定律 。 现 在 考虑 图 12-10。 情 况 1 显 示 出 单个 电阻 的 欧姆 定律 ， 这 是 一 
个 称 为 电阻 器 (resistor) 的 电路 元 件 ， 电 阻 器 可 以 是 一 个 灯泡 的 灯丝 、 电 路 板 上 的 一 个 电阻 器 件 
或 者 集成 电路 内 部 的 一 个 电阻 。 请 注意 电流 I 是 如 何 通过 电阻 元 件 R 在 电阻 元 件 两 侧 产 生 电压 V 的 。 


| 
“情况 1> 电 流通 过 单个 电阻 ~—~VVV 一 


“情况 2> 电 流通 过 多 个 电阻 
| R1 R2 R3 R4 





V total 


V total = Vi + V2 + V3 + V4 = IxR1 + lxR2 + IxR3 + IxR4 = lx( R1 + R2 + R3 + R4) 
Rtotal = R1+R2+R3+R4 
V total = | x R total 


图 12-10 针对 单个 电阻 器 和 一 系列 电阻 器 的 欧姆 定律 


情况 2 与 情况 1 类 似 ， 不 同 之 处 是 现在 有 了 一 系列 的 电阻 器 。 电 流 从 一 个 电阻 器 流向 下 一 
个 电阻 器 。 由 于 流 经 每 个 电阻 器 的 电流 都 是 相同 的 ， 我 们 就 可 以 如 图 所 示 简 化 方程 。 如 你 所 
见 ， 穿 越 整个 电路 的 电压 就 是 穿越 每 个 单独 电阻 器 的 电压 之 和 。 然 而 ， 对 于 我 们 的 A/D 讨 论 来 
说 重要 的 一 点 是 ， 如 果 电 阻 值 都 相同 ， 则 穿越 每 个 电阻 器 的 电压 就 相同 。 

假设 在 图 12-10 中 我 们 有 10 个 电阻 器 ， 每 个 电阻 器 恰好 都 是 1000 欧 姆 。 现 在 ， 我 们 将 这 一 
连 串 电阻 器 的 一 端 连接 到 10V ， 另 一 端 连接 到 0V。 这 10 个 串联 的 电阻 器 加 起 来 共 10 000 欧 姆 ， 
而 穿越 所 有 10 个 电阻 器 的 总 电压 是 10V。 根 据 欧姆 定律 ， 流 经 电路 的 电 访 I=10V/10 0008， 即 
1 毫 安 (lmA)。1lmA 流 经 每 个 电阻 器 产生 恰好 1V 电 压 ， 所 以 ， 每 个 电阻 器 的 连接 点 处 的 电压 
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恰好 比 前 一 个 高 1V， 这 种 类 型 的 电路 称 为 分 压 器 (voltage divider)， 因 为 它 将 总 电压 分 成 了 
比较 小 的 部 分 。 

现在 ,我 们 有 了 足够 的 信息 来 理解 如 何 真 正 地 构建 A/D 转 换 器 (但 不 要 告诉 国际 电子 电路 
设计 者 同业 会 )。 图 12-11 是 一 个 快 闪 A/D 转 换 器 (flash A/D converter) 的 简化 图 。 它 获得 这 
样 一 个 名 称 的 原因 是 其 极为 快速 。 快 内 转换 器 包含 一 堆 比 较 器 。 

商业 上 可 得 到 的 电路 有 的 多 达 4 096 个 比较 器 。 每 个 比较 器 的 负 端 连接 到 分 压 器 的 一 个 连 
接点 (分 接头 )。 分 压 器 中 的 电阻 器 数量 比 电 路 中 的 比较 器 的 数量 多 一 个 。 每 个 电阻 器 具有 相 
同 电阻 值 ， 所 以 每 个 分 接头 处 的 电压 都 以 相同 的 幅度 递增 。 该 电阻 串 的 末端 连接 到 一 个 稳定 
的 参考 电压 ， 比 如 10.000V 。 

关键 的 一 点 是 这 一 串 电 阻 器 中 的 每 一 个 都 有 相同 的 值 ， 这 使 得 我 们 能 将 参考 电 庄 划 分 成 
任意 多 的 参考 点 , 这 些 参 考点 是 为 产生 一 个 具有 足够 精确 度 的 快 内 A/D 转 换 器 所 需要 的 。 然而， 
我 们 不 能 只 是 盲目 地 进行 。 每 次 我 们 要 求 多 一 位 的 分 辩 率 ， 我 们 所 需要 的 比较 器 和 电阻 器 的 
数量 就 会 成 倍 地 增长 。 

现在 你 可 能 在 想 ， 既 然 能 建造 具有 5 千 万 晶体 管 的 集成 电路 ， 为 什么 不 能 建造 一 个 只 具有 
微不足道 的 8 千 个 电阻 器 和 比较 器 的 A/ 了 转换 器 呢 ? 问题 就 在 于 模拟 电路 不 能 像 数 字 电路 那样 
严格 地 进行 压缩 ， 而 电阻 器 是 非常 大 的 电路 元 件 。 而 且 ， 数 字 电 路 能 够 吸引 我 们 的 一 个 特色 
就 是 其 对 电 平 在 一 个 相当 宽 范 围 内 的 变化 不 敏感 ， 这 恰 与 我 们 在 使 用 模拟 电子 器 件 时 相反 。 
这 样 ， 制 造 8 192 个 相同 的 电阻 器 和 8 192 个 具有 完全 相同 开关 特性 的 比较 器 就 是 电路 设计 的 一 
个 巨大 (昂贵 ) 的 壮举 。 

图 12-11 的 电路 与 我 们 在 图 12-9 中 看 到 的 简单 模型 进行 的 工作 是 完全 一 样 的 ， 只 有 一 点 不 
同 ， 就 是 我 们 加 入 了 一 个 逻辑 电路 ， 它 将 来 自 这 一 堆 比 较 器 的 数字 码 转 换 成 了 真正 的 二 进 制 
码 。 这 样 ， 如 果 我 们 有 一 个 含 255 个 比较 器 的 快 内 转换 器 ， 而 且 未 知 的 电压 恰好 是 参考 电压 的 
1/2， 那么 我 们 就 能 预料 到 最 下 面 的 128 个 比较 器 将 全 会 输出 1， 而 其 他 127 个 比较 器 将 会 输出 0。 
数字 电路 接着 就 会 将 输入 码 转 换 成 真正 的 二 进 制 输出 代码 。 算 法 会 是 什么 样 的 呢 ? 虽然 看 起 
来 有 点 宛 长 乏味 ， 但 凭 你 现在 的 知识 来 做 这 个 设计 已 经 足够 用 了 。 你 将 会 有 255 个 输入 和 8 个 
输出 。 仅 需要 多 加 一 些 逻 辑 门 就 能 实现 这 个 电路 。 
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数字 化 输出 


图 12-11 快 内 A/D 转 换 器 
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为 了 将 具有 逻辑 “1 ”输出 的 最 高 比较 器 的 编号 转换 成 二 进 制 码 ， 我 们 需要 一 个 称 为 优先 
级 编码 器 (priority encoder) 的 逻辑 电路 。 这 样 ，255 个 比较 器 就 会 产生 一 个 真正 的 8 位 二 进 制 
码 作为 输出 。 

快 内 A/D 转 换 器 是 快速 的 ， 因 为 其 用 于 信号 数字 化 所 需 时 间 仅 仅 是 信号 在 比较 器 和 优先 级 
编码 器 中 的 传播 速度 的 简单 函数 。 通 常 快 内 A/D 转 换 器 都 能 在 每 10ns 数 字 化 一 个 信号 ， 在 一 些 
极端 情况 下 ， 需 要 的 时 间 更 少 。 快 内 转换 器 最 为 从 事 冲击 波 研究 的 人 所 喜爱 ， 因 为 在 冲击 波 
毁坏 所 有 传感器 前 ， 你 可 以 获得 很 多 炸弹 冲击 波 数据 。 

让 我 们 总 结 一 下 快 内 转换 器 的 知识 : 

* 可 允许 的 输入 电压 范围 是 0V 到 4/5Vr (参考 电压 )。 

。A/D 转 换 器 的 分 辩 率 是 2 位 。 

“假设 参考 电压 Vse = 5SV， 我 们 只 能 将 未 知 电压 V, 数 字 化 成 TV 的 精确 度 。 

“为 了 达到 8 位 精确 度 ， 我 们 需要 256 个 相配 的 电阻 器 和 255 个 相配 的 比较 器 。 

从 概念 上 看 ， 快 内 A/D 转 换 器 是 最 容易 理解 的 ， 但 它 却 不 是 最 常用 的 A/D 转 换 器 类 型 ， 主 
要 是 因为 当 我 们 试图 得 到 10 位 以 上 的 精确 度 时 ， 就 会 导致 指数 复杂 度 。 记 住 ， 每 增加 额外 一 
位 的 分 辩 率 ， 就 需要 将 相配 的 比较 器 和 电阻 器 数量 加 倍 。 

为 了 理解 通常 的 A/D 转 换 器 如 何 工作 ， 我 们 需要 理解 D/A 转 换 器 的 电路 。 数 字模 拟 转换 器 
与 A/D 转 换 器 有 相反 的 功能 ， 因 为 它 是 基于 数字 输入 码 来 产生 模拟 输出 电压 的 。 下 面 图 12-12 
所 示 的 就 是 一 个 简单 的 4 位 D/A 转 换 器 。 








Vref 


开关 
电流 的 和 在 该 节点 产 
生 输 出 电压 





1= (QO xj) + {Q1 x2) + (Q2x 4)+(Q3 x 8) 


图 12-12 一 个 4 位 的 数字 到 模拟 转换 器 


看 起 来 像 数字 8 的 符号 就 是 称 为 电流 源 (current source) 的 电路 元 件 。 只 要 有 完备 的 电路 ， 
每 个 电路 元 件 都 能 产生 持续 稳定 的 电流 。 来 自 每 个 电流 源 的 电流 幅度 以 2 为 级 数 增长 ， 即 1、2、 
4、8、16， 等 等 。 假 设 图 12-12 中 “i” 的 值 是 0.1mA ， 则 第 一 个 电流 源 输 出 到 地 的 电流 就 是 
0.1mA， 第 二 个 电流 源 输出 0.2mA， 其 他 电流 源 的 输出 依 此 类 推 。 每 个 电流 源 还 有 一 个 开关 
(开关 由 中 心 画 “x” 的 圆圈 符号 表示 ) ， 该 开关 由 表示 成 4 位 输出 端口 的 数字 输入 信号 控制 。 
如 果 该 数字 信号 是 0， 就 没有 电流 流 过 电流 源 。 如 何 该 数字 信号 是 1， 电 流 就 通过 公用 导线 和 
电阻 器 流 到 地 。 . 

来 自 每 个 电流 源 的 电流 汇聚 在 一 起 ， 流 过 一 个 电阻 器 R。 在 这 个 电路 中 ， 如 果 R = 1000 欧 
姆 ， 并 且 所 有 电流 源 都 打开 ， 则 我 们 就 有 15 x 0.1mA， 即 1.5mA 流 经 一 个 1000 欧 姆 的 电阻 器 ， 
能 得 到 1.5V 的 电压 。 这 样 ， 从 0 到 $F 的 数字 码 将 以 0.1V 为 台阶 给 出 从 0V 到 1.5V 的 模拟 电压 。 
现在 我 们 就 准备 好 来 了 解 A/D 转 换 器 是 如 何 实 际 工作 的 。 

图 12-13 是 一 个 16 位 模拟 到 数字 转换 器 的 简 图 。 在 它 的 中 心 是 一 个 16 位 D/A 转换 器 和 一 个 
比较 器 。 电 路 的 操作 非常 简单 。 我 们 首先 将 数字 码 $80000 施 加 于 该 D/A 转换 器 ，D/A 转 换 器 的 
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输出 是 0V。 该 输出 被 施加 在 了 比较 器 的 负 输 入 ， 而 我 们 想 要 数字 化 的 电压 施加 于 比较 器 的 正 
输入 。 然 后 ， 我 们 将 数字 码 加 1 并 将 该 16 位 码 施加 于 D/A 转换 器 。 因 为 可 有 65 534 个 码 ， 所 以 
输出 电压 只 略微 增加 。 然 而 ， 我 们 也 检查 比较 器 的 输出 ， 看 看 其 是 否 从 1 变 为 0。 当 比较 器 的 
输出 改变 状态 时 ， 我 们 就 知道 D/A 转换 器 的 输出 电压 只 是 略微 大 于 该 未 知 电压 。 


Vout = > VX 
16 位 D/A 转换 器 





D15 


到 W/O 端口 


TEST 


图 12-13 一 个 16 位 单 坡 模 拟 到 数字 转换 器 


当 其 改变 状态 时 ， 我 们 停止 加 数 ， 比 较 器 改变 状态 时 的 数字 码 就 是 未 知 模拟 电压 的 数字 
值 ， 我 们 称 此 为 单 坡 (single-ramp) AD 转换 器 ， 因 为 我 们 是 按 一 个 线性 斜坡 增加 测试 电压 直 
至 测试 电压 和 未 知 电压 相等 的 。 

想像 你 正在 建立 一 个 单 坡 A/D 转 换 器 ， 作 为 基于 计算 机 的 数据 记录 系统 的 一 部 分 。 你 应 该 
有 一 个 16 位 的 VO 端口 作为 数据 输出 端口 ， 还 有 一 个 单个 位 的 〈( TEST ) 输入 来 对 比较 器 的 输 
出 状态 进行 采样 。 你 从 一 个 初始 状态 开始 ， 持 续 地 对 数字 码 加 1， 并 对 TE5T 输入 进行 采样 ， 
直至 看 到 TEST 输入 变 低 。 单 坡 A/D 转 换算 法 的 流程 图 如 图 12-14 所 示 。 





图 12-14 单 坡 A/D 转 换 器 的 算法 


” 单 坡 方法 有 一 个 问题 ， 就 是 数字 化 时 间 是 变化 的 。 低 电压 数字 化 得 很 快 ， 高 电压 就 需要 ”B42 
较 长 的 时 间 。 而 且 ， 单 坡 算法 类 似 于 线性 搜索 算法 。 我 们 已 经 知道 ， 二 又 搜索 的 效率 比 线性 
搜索 高 ， 所 以 ， 你 可 能 也 想像 得 到 ， 我 们 也 可 以 用 这 种 类 型 的 电路 将 二 又 搜索 实现 在 硬件 中 ， 

并 在 未 知 电压 处 比较 器 得 到 连续 零 的 收入 。 这 就 是 称 为 逐步 各 近 (successive approximation) 
的 AD 转换 器 ， 它 是 目前 最 常 使 用 的 设计 方式 。 
逐步 逼近 A/D 转 换 器 的 算法 就 如 同 二 又 搜 索 。 我 们 是 从 0x8000， 而 不 是 从 0x0000 开 始 。 
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我 们 检查 比较 器 的 输出 是 1 还 是 0， 并 依 此 将 下 一 个 最 高 有 效 位 设置 为 1 或 0。 这 样 ， 通 过 16 次 
测试 (而 不 是 多 达 65 535 次 ) ，16 位 AD 转换 器 就 能 确定 未 知 电压 。 

最 后 一 种 类 型 的 A/D 转 换 器 就 是 电压 到 频率 转换 器 ， 即 V/F 转 换 器 。 这 个 转换 器 将 输入 电 
压 转 换 成 数字 脉冲 流 ， 这 个 脉冲 流 的 频率 与 模拟 电压 成 正比 。 例 如 ， 一 个 VF 可 有 每 伏特 10kHz 
的 转换 函数 。 这 样 ， 输 入 1V， 就 有 10 000Hz 的 频率 输出 。 对 于 10V 输 入 ， 就 有 100 000Hz 的 输出 ， 
等 等 。 由 于 我 们 知道 如 何 精确 地 测量 与 时 间 相关 的 量 ， 所 以 就 有 可 能 非常 精确 地 测量 频率 和 计 
算 脉 冲 ， 我 们 就 能 有 效 地 进行 电压 到 时 间 的 转换 。 

VI/F 转 换 器 有 一 个 非常 有 吸引 力 的 特性 ， 就 是 在 过 滤 掉 输入 信号 中 的 噪声 方面 极其 有 效 。 
假设 V/F 转 换 器 的 输出 大 约 是 50 000Hz。 每 一 秒 V/F 发 出 大 约 50 000 个 脉冲 。 如 果 持 续 计数 并 
累加 ， 那 么 在 10 秒 内 将 计数 到 500 000 个 脉冲 ， 在 100 秒 内 将 计数 到 5 000 000 个 脉冲 ， 等 等 。 

在 更 精确 的 标 度 上 ， 也 许 每 秒 的 计数 有 时 比 50 000 还 要 稍 大 一 些 ， 有 时 要 稍 小 一 些 。 我 
们 持续 计数 的 时 间 越 长 ， 我 们 就 越 能 将 未 知 电压 中 的 噪声 平均 掉 。 这 样 ， 如 果 我 们 原意 等 待 
足够 长 的 时 间 ， 而 且 在 这 段 时 间 输 入 电压 是 稳定 的 ， 我 们 就 能 将 其 平均 到 一 个 很 高 的 精确 度 。 

既然 我 们 明白 了 模拟 到 数字 转换 器 如 何 实际 地 工作 ， 就 让 我 们 看 一 个 可 用 于 测量 若干 个 
模拟 输入 的 完整 的 数据 记录 系统 。 

图 12-15 就 是 这 种 数据 记录 系统 的 简化 示意 图 ， 图 中 有 几 个 电路 元 件 我 们 以 前 没有 讨论 过 。 
在 这 个 例子 中 没有 必要 详细 分 析 其 如 何 工 作 ， 我 们 只 考察 它们 的 总 体操 作 ， 以 理解 数据 记录 
过 程 如 何 进行 。 
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图 12-15 基于 计算 机 的 数据 记录 系统 的 简化 示意 图 
标记 为 “信和 号 调整 ”的 功能 块 通常 是 一 组 放大 器 或 其 他 形式 的 信号 转换 器 ， 其 目的 是 将 
来 自传 感 器 的 模拟 信号 转换 为 A/D 转 换 器 范围 内 的 某 个 电压 。 例 如 ， 假 设 我 们 正在 试图 测量 
来 自传 感 器 的 输出 信号 ， 访 输出 电压 的 范围 是 0 到 1mV。 如 果 我 们 将 读 信号 直接 馈 入 一 个 具有 
0 一 10V 输 入 范围 的 A/D 转 换 器 ， 则 我 们 将 永远 也 看 不 到 传感器 的 输出 。 这 样 ， 我 们 就 要 用 一 
个 模拟 放大 器 将 传感器 的 0 到 0.001V 范 围 的 信号 放大 到 0 到 10V 范 围 。 
假设 每 个 模拟 通道 有 不 同 的 放大 要 求 ， 这 样 每 个 通道 就 用 自己 的 放大 器 或 其 他 类 型 的 信 
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号 调节 器 独自 处 理 。 其 要 点 就 是 我 们 想 让 每 个 通道 的 传感器 范围 与 A/D 转 换 器 的 输入 范围 达到 
最 优 匹配 。 请 注意 这 个 数据 记录 系统 被 设计 成 用 来 监视 8 个 输入 通道 的 。 我 们 可 将 A/D 转 换 器 
连接 到 每 个 通道 ， 但 通常 这 不 是 最 经 济 的 解决 方案 。 另 一 个 模拟 电路 元 件 称 为 模拟 多 路 选择 
器 (analog mnultiplexer) ， 用 于 顺序 地 将 每 个 模拟 通道 连接 到 A/D 转 换 器 。 从 真实 的 意义 上 看 ， 
模拟 多 路 选择 器 就 像 一 组 三 态 输出 器 件 连 到 公用 总 线 ， 一 次 只 允许 一 个 输出 连接 到 总 线 。 这 
里 的 不 同 之 处 是 模拟 多 路 选择 器 能 够 保持 其 输入 信号 的 模拟 电压 。 

下 一 个 器 件 称 为 采样 和 保持 模块 (sample and hold module, S/H)。 要 和 弄 清 楚 其 功能 需要 稍 
加 解释 。S/H 模 块 使 我 们 能 对 随时 间 变 化 的 模拟 信号 进行 数字 化 。 从 前 面 我 们 知道 对 模拟 电压 
进行 数字 化 可 能 需要 相当 多 的 时 间 。 单 坡 A/D 可 能 要 计数 到 几 千 次 才能 与 未 知 电压 匹配 。 在 以 
上 这 些 例子 中 我 们 总 是 假设 未 知 模拟 电压 是 精密 且 恒 定 的 。 假 设 我 们 要 精确 数字 化 的 是 小 提 
琴 的 声音 ， 在 某 时 刻 我 们 想 知道 小 提琴 波形 上 的 一 个 电压 点 ， 怎 么 办 呢 ? 如 果 在 A/D 转 换 器 进 
行 数字 化 期 间 小 提 座 的 未 知 电 压 变 化 很 大 ， 就 会 产生 很 大 误差 。S/H 就 能 解决 这 个 问题 。 

S/H 模块 就 像 一 个 视频 冻结 帧 。 当 数字 输入 处 于 采样 位 置 (S/ 五 =1) 时 ， 模 拟 输 出 就 追 
随 数 字 输 入 。 当 S/ 及 变 低 时 ， 模 拟 电 压 就 及 时 冻结 ，A/D 转 换 器 就 有 精确 对 其 进行 数字 化 的 
机 会 。 为 弄 明白 为 什么 是 这 样 ， 让 我 们 看 一 个 简单 的 例子 。 设 想 我 们 要 试图 对 一 个 以 10kHz 频 
率 震 荡 的 正弦 波 进行 数字 化 ， 假 设 该 正弦 波 的 振幅 是 土 5。 这 样 ， 

V(1) = Ssin(wrt) 
其 中 w 是 该 正 东 波 的 角 频 率 ， 以 每 秒 的 弧度 来 度量 。 如 果 这 对 你 比较 陌生 ， 那 么 只 要 相信 我 继 
续 下 去 就 行 了 。 角 频率 就 是 2xf， 其 中 是正 蓄 波 的 实际 频率 ， 用 赫兹 (每 秒 周期 数 ) 度量 。 电 
压 变化 的 速率 就 是 V(D 的 一 阶 导数 : 
dV/dt = —5wcos(wt) = —10nfcos(w?) 
电压 随时 间 变 化 的 最 大 速率 发 生 在 当 cos(w?) = 1 时 ， 故 
dV/dt (最 大 值 ) = 一 10nf， 即 一 31.4x10x106 


这 样 ， 电 压 随时 间 变 化 的 最 大 速率 是 每 hs0.314V。 现 在 ， 如 果 我 们 的 A/D 转 换 器 做 一 次 转换 
需要 5hs， 则 在 转换 进行 期 间 未 知 电压 可 能 改变 约 1.5V。 由 于 这 通常 是 一 个 不 可 接受 的 大 的 错 
误 源 ， 我 们 就 需要 S/H 模块 在 转换 进行 期 间 向 A/D 转 换 器 提供 一 个 稳定 的 信号 。 

我 们 现在 已 知道 了 足够 的 关于 系统 如 何 发 挥 作用 的 知识 ， 让 我 们 做 一 个 逐步 的 分 析 : 

1. 输出 端口 0 的 位 2 : 4 用 于 选择 期 望 的 模拟 通道 连接 到 S/H 模块 。 

2. 调节 后 的 模拟 电压 出 现在 S/H 模块 的 输入 端 。 

3. 输出 端口 0 的 位 1 变 低 ， 将 S/H 模块 置 于 保持 模式 。S/H 变 低 的 时 刻 ， 要 数字 化 的 模拟 输 
入 电压 就 锁定 其 值 。 

4. 输 出 端口 0 的 位 0 向 A/D 转 换 器 发 出 一 个 正 脉冲 ， 引 发 一 个 转换 周期 。 

5. 在 需要 的 转换 间隔 后 ， 转 换 结束 信号 ( EOC ) 变 低 ， 引 起 一 个 计算 机 的 中 断 。 

6. 计算 机 进入 其 AD 转换 器 的 ISR 并 读 进 数字 数据 。 

7. 依靠 这 个 算法 ， 它 还 可 以 选择 另 一 个 通道 并 读 另 一 个 输入 值 ， 或 者 继续 如 前 面 一 样 继 
续 对 这 个 通道 进行 数字 化 。 

图 12-16 总 结 了 建立 任意 速度 和 精确 性 的 A/D 转 换 器 的 困难 程度 。 标 记 为 “SK” 的 区 域 虽 
然 在 理论 上 做 起 来 是 相当 简单 的 ， 但 常常 需要 应 用 领域 的 专门 知识 。 例 如 ， 一 个 心脏 监视 器 
可 能 相对 比较 慢 ， 并 且 具 有 中 等 精确 度 ， 但 由 于 需要 保护 患者 免除 任何 休克 危险 ， 这 就 对 设 ”B49 
计 者 提出 了 额外 的 要 求 。 
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图 12-16 该 图 总 结 了 在 给 出 精确 度 和 转换 速率 情况 下 制造 AID 转换 器 的 困难 程度 。 来 自 Horn 


12.6 A/D 和 D/A 转换 器 的 分 辨 率 


在 离开 模拟 数字 转换 和 数字 模拟 转换 这 个 话题 之 前 ， 我 们 应 该 对 转换 颖 分 辩 率 的 意思 作 一 讨 
论 总 结 。 这 个 讨论 也 同样 适用 于 D/A 转换 器 ， 但 从 A/D 转 换 器 的 角度 来 看 更 容易 理解 一 些 ， 所 以 
我 们 就 这 样 做 了 。 当 我 们 试图 将 模拟 电压 、 电 流 或 电阻 (记得 欧姆 定律 吗 ? ) 转换 成 相应 的 数字 
值 时 ， 我 们 就 面临 一 个 基本 的 问题 。 模 拟 电压 是 连续 变化 的 量 ， 而 数字 只 能 表示 成 离散 的 值 。 

从 C++ 编 程 类 中 你 已 经 熟悉 了 这 个 问题 。 你 知道 (或 者 应 该 知道 ) 某 些 操作 是 有 潜在 危险 
的 ， 因 为 它们 会 导致 错误 的 结果 。 在 编程 中 ， 我 们 称 此 为 “ 舍 入 错误 ”。 考 虑 下 面 的 例子 : 

float A=3.1415906732678; 

float B=3.1415906732566; 

if (A==B) 

{ 做 某 些 事 } 


else 
{ 做 另外 一 些 事 } 
该 程序 会 做 什么 呢 ? 除非 你 知道 在 计算 机 上 用 一 个 浮 点 数 能 表示 多 少 位 的 精度 ， 否 则 你 不 一 
定 能 得 到 你 期 望 的 结果 。 对 于 A/D 转 换 器 我 们 有 同样 的 问题 。 假 设 我 有 一 个 精密 的 电压 源 ， 这 
是 一 个 能 在 长 时 间 提 供 非常 稳定 电压 的 电子 设备 。 典 型 情况 下 ， 可 采用 称 为 标准 电光 
(standard cell) 的 特殊 电池 。 假 设 我 们 刚 花 了 500 美 元 ， 并 将 我 们 的 标准 电池 送 回 了 位 于 马里 
兰州 Gaithersburg 的 国家 标准 测试 研究 所 (NIST)。 
过 了 几 周 ， 我 们 从 NIST 取 回 标准 电池 和 校准 证 ， 校 准 证 说 明 标 准 电 池上 的 电压 在 23 摄 氏 
度 时 是 +1.542324567V (相对 于 温度 变化 有 一 个 轻微 的 电压 变化 ， 但 我 们 能 计算 出 来 ) 。 现 在 ， 
我 们 将 这 个 电池 装配 到 我 们 的 A/D 转 换 器 上 并 读数 。 我 们 将 会 度量 到 什么 值 呢 ? 
现在 你 还 没有 足够 的 信息 来 回答 ， 所 以 让 我 们 更 具体 一 点 : 
A/D 范 围 : 0V~+2.00V 
A/D 分 辨 率 : 10 位 
A/D 精 确 度 : 土 1/2 最 低 有 效 位 (LSB) 
这 意味 着 对 从 0.00V 到 +2.00V 的 模拟 输入 范围 ， 我 们 有 1024 个 数字 码 可 用 来 表示 模拟 电压 。 我 
们 知道 0.00V 应 该 给 出 数字 值 00 0000 0000，+2.00V 应 该 给 出 数字 值 11 1111 1111, 但 在 这 两 
个 值 之 间 是 什么 情况 呢 ? 在 哪 一 点 数字 码 从 0x000 变 化 到 0x001? 换 句 话说 ,我 们 的 A/D 转 换 
器 对 模拟 输入 电压 的 变化 或 波动 有 多 么 敏感 ? 
让 我 们 尝试 计算 出 来 。 由 于 在 0x000 和 0x3FF 之 间 有 1023 个 区 间 间 隔 ， 所 以 我 们 能 计算 出 
模拟 电压 的 什么 区 间 间 隔 对 应 于 数字 化 值 的 1 位 变化 。 
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因此 ，2.00/1023=1.9550 x 10“V。 这 样 ， 每 次 模拟 电压 变化 2mV ( 毫 伏 ) 左右 时 ， 我 们 
就 应 该 能 看 到 数字 码 也 变化 了 一 个 单位 。 这 个 2mV 的 值 也 就 是 我 们 所 称 的 最 低 有 效 位 ， 因 为 
这 个 电压 量 的 变化 将 导致 LSB 变 化 1 个 单位 。 

参见 图 12-17。 阶 梯形 曲线 代表 A/D 转 换 器 的 转换 函数 ， 它 表明 了 数字 码 作为 模拟 输入 电 
压 的 函数 是 如 何 变 化 的 。 注 意 数字 码 0x000 是 如 何在 模拟 电压 上 升 到 差不多 1mV 时 增加 的 。 由 
于 精确 度 是 LSB 的 1/2， 我 们 就 有 一 个 围绕 模拟 区 间 间 隔 中 心 (垂直 虚线 ) 的 模拟 电压 范围 。 
这 是 一 个 由 线 的 水 平 部 分 定义 的 区 域 。 例 如 ， 对 于 一 个 刚好 处 于 lmV 以 下 、3mV 以 上 这 个 范 
围 内 的 模拟 电压 ， 数 字 码 将 是 $001。 





2 
模拟 电压 (mV) 


图 12-17 范围 为 0 到 2.00V 的 10 位 A/D 转 换 器 的 转换 函数 。 精 确 度 是 1/2 LSB 


如 果 模 拟 电压 刚好 处 于 转换 点 会 发 生 什 么 情况 呢 ? 假设 其 刚好 是 0.977SmvV 会 怎么 样 ? 数字 码 
会 是 $000 或 $001 吗 ?答案 是 :;“ 谁 知道 呢 ? ”有 了 时 它 可 能 会 被 数字 化 成 $000， 而 另外 一 些 时 候 它 
会 被 数字 化 成 $001。 | 

现在 回 到 我 们 的 标准 电池 。 回 忆 可 知 ， 标 准 电 池上 的 电压 是 +1.542324567V。 数 字 码 应 该 
是 多 少 呢 ?+1.542324567/(1.9550 x 10-3) =788.913， 近 似 等 于 789。 用 十 六 进 制 ，789,0 等 于 
0x315， 所 以 这 就 是 我 们 可 能 会 看 到 的 数字 码 。 

这 个 分 辩 率 足够 好 了 吗 ? 这 是 一 个 难以 回答 的 问题 ， 除 非 我 们 知道 问题 的 背景 。 假 设 我 
们 得 到 了 一 个 任务 ， 要 写 一 个 软件 包 ， 用 于 控制 制造 车 间 中 的 熔炉 。 熔 炉 中 发 生 的 过 程 对 温 
度 的 波动 相当 敏感 ， 所 以 我 们 必须 进行 严密 的 控制 。 具 体 地 说 ， 就 是 温度 必须 保持 在 恰好 400 
摄氏 度 土 0.1 摄 氏 度 。 现 在 ， 熔 炉 中 的 温度 由 热电 偶 监 视 ， 其 电压 输出 度量 如 下 : 

电压 输出 @400 摄 氏 度 = 85.000mV 

转换 函数 = 0.02mV/ 摄 氏 度 
至 此 ， 看 起 来 不 是 很 有 希望 。 但 是 ， 我 们 能 做 一 些 事 情 来 改善 这 种 状况 。 我 们 能 做 的 第 一 件 
事情 就 是 用 热电 偶 对 很 低 的 电压 输出 进行 放大 ， 将 其 提高 到 更 易 处 理 的 水 平 。 如 果 我 们 使 用 
一 个 能 将 输入 电压 放大 20 倍 (增益 =20) 的 放大 器 ， 则 模拟 信号 就 会 变 为 ; 

电压 输出 @400 摄 氏 度 (x 20) = 1.7000V 

转换 函数 ( x 20) = 0.4mV/ 摄 氏 度 
现在 模拟 电压 的 范围 就 可 以 了 。 我 们 的 信号 在 400 摄 氏 度 时 是 1.7V， 这 低 于 A/D 转 换 器 的 最 大 电压 
2.00V， 所 以 我 们 就 没有 任何 超出 度量 范围 的 危险 。 分 辩 率 怎么 样 呢 ? 我 们 知道 ， 在 A/D 转 换 器 检 
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测 到 一 个 变化 之 前 ， 模 拟 信 号 可 在 差不多 2mV 的 范围 变化 。 参 考 一 下 我 们 对 放大 热电 偶 的 指定 ， 
这 就 意味 着 在 A/D 转 换 器 检测 到 一 个 变化 之 前 ,温度 可 变化 大 约 5 摄氏 度 。 由 于 我 们 需要 将 系统 控 
制 到 好 于 0.1 度 ， 所 以 我 们 需要 使 用 具有 更 好 分 辨 率 的 A/D 转 换 器 。 要 多 好 昵 ? 我 们 预知 0.1 摄 氏 度 
的 温度 变化 将 会 引起 0.04mV 的 电压 变化 ， 因 此 ， 我 们 必须 将 分 辨 率 改进 2mV/0.04mV， 即 50 倍 1! 
这 可 能 吗 ? 假如 我 们 决定 在 esBay 上 卖 掉 10 位 A/D 转 换 器 并 用 所 得 收益 买 一 个 新 的 A/D 转 换 
器 。12 位 转换 器 怎么 样 ? 这 会 给 我 们 4096 个 数字 码 。 从 1024 个 数字 码 到 4096 个 数字 码 在 分 辨 
率 上 只 有 4 倍 的 改进 ， 而 我 们 需要 50 倍 的 改进 。 一 个 16 位 的 A/D 转 换 器 能 给 我 们 65 536 个 数字 
码 ， 这 是 64 倍 的 改进 。 这 刚好 能 行 ! 现在 ， 我 们 就 有 : 
A/D 范 围 : 0V ~ +2.00V 
A/D 分 辩 率 : 16 位 
A/D 精 确 度 : 土 1/2 最 低 有 效 位 (LSB) 
我 们 的 模拟 分 辩 率 现在 就 是 每 数字 码 2.00V/65 536， 即 0.03mA。 由 于 我 们 需要 能 检测 
0.04mV 的 变化 ， 所 以 这 个 新 的 转换 器 能 为 我 们 工作 。 


总 结 


YE 二 口 
第 12 章 涵盖 了 以 下 内 容 : 
。 作为 一 种 处 理 异 步 事件 方法 的 中 断 概 念 。 
。 计算 机 系统 如 何 通过 IO 端 日 与 外 部 世界 打交道 。 
。 通 过 模拟 到 数字 转换 和 数字 到 模拟 转换 ， 如 何 将 外 部 事件 中 的 物理 量 转换 成 与 计算 机 
兼容 的 格式 或 反之 。 
。 对 被 称 为 比较 器 的 模拟 到 数字 接口 器 件 的 需要 。 
。 如 何 用 欧姆 定律 为 A/D 转 换 和 D/A 转换 确立 固定 电压 点 。 
。 不 同类 型 的 AD 转换 器 及 其 优 缺 点 。 
。 精确 度 和 分 辩 率 是 如 何 影响 A/D 转 换 过 程 的 。 


! Glenn E. Reeves, “Priority Inversion: How We Found It How We Fixed It,” Dr Dobb's Journal November, 1999, p. 21. 


? Arnold S. Berger, A Brief Introduction to Embedded Systems with a Focus on Y2K Issues, Presented at the Electric 
Power Research Institute Workshop on the Year 2000 Problem in Embedded Systems, August 24—27, 1998， 
San Diego, CA. 


3 Jerry Hom, High-Performance Mixed-Signal Design, http://www.chipcenter.com/eexpert/jhorn/jhornO15.html. 


习题 
1. 用 Motorola 68000 汇 编 语言 写 一 个 子 程序 ， 使 得 一 个 串 行 UART 器 件 能 根据 下 述 定义 传送 一 
串 ASCII 字 符 : 
a. UART 是 映射 在 存储 器 字 节 地 址 位 置 $2000 到 $2001 的 。 
b. 向 地 址 $2000 写 一 个 字 节 数据 将 会 自动 启动 一 个 数据 传送 过 程 ， 该 过 程 会 将 状态 寄存 器 的 
传送 缓冲 器 空 标志 (TBMT) 置 为 0。 
c. 当 数据 字 节 被 发 送 后 ，TBMT 标 志 将 自动 返回 到 1， 指 明 TBMT 为 真 。 
d. 状态 寄存 器 是 映射 在 存储 器 字 节 位 置 $2001 的 。 这 是 一 个 只 读 寄 存 器 ， 有 用 的 位 只 有 DB0， 
就 是 TBMT 标 志 。 
e. 要 传送 的 字符 串 的 存储 地 址 通过 寄存 器 A6 传 送 给 子 程序 。 
f 子 程序 不 返回 任何 值 。 
g: 子 程序 中 使 用 的 所 有 寄存 器 必须 在 进入 子 程序 时 被 存储 起 来 ， 并 在 返回 时 恢复 。 
h. 所 有 的 字符 串 都 由 可 打印 的 ASCII 字 符 集中 的 00 到 $7F 的 字符 组 成 ， 这 些 字符 具有 连续 的 
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存储 位 置 ， 字 符 串 以 $FF 结 束 。 


UART 的 示意 图 如 下 所 示 : 
移出 数据 寄存 器 
— CITTT TIT #000 
DB7 DB0 


状态 寄存 器 
ed 存储 地 址 $2001 
DB0 TB = TBMT 标 志 
X = 无关 项 





2. 考察 如 下 所 示 的 68K 汇 编 语言 代码 块 。 代 码 中 有 一 个 严重 的 错误 。 下 面 还 给 出 了 存储 器 前 
32 字 节 的 内 容 。 
a. 代码 中 的 错误 是 什么 ? 
& 当 错误 发 生 时 处 理 串 将 会 做 什 么 4 根据 你 已 有 的 信息 ， 尽 量 给 出 完整 的 解释 


org $400 

start lea $2000,A0 

E move.l1 #$00001000,D0 

move.1 #$0000010,D1 

loop divu D1,D0 
move . 工 DO, (A0)+ 
subq.b #08,D1 
bpl loop 
end $400 


存储 器 内 容 (部 分 ) 
00000000 00 00 ao 00 00 00 04 00 00 AA 00 00 00 AA 00 00 


00000010 00 AR 00 00 00 CCAA00 00AA0000 00AA00 O00 


注释 : 异常 向 量 表 中 的 前 几 个 向 量 列表 如 下 : 


-一 





向 量 # 存储 器 地 址 描 述 
0 $00000000 复位 : 管理 堆栈 指针 
1 $00000004 | 复位 : 程序 计数 器 
2 $00000008 总 线 错误 
3 $0000000C 地 址 错误 
4 $00000010 非法 指令 
5 $00000014 用 零 除 
6 $00000018 CHK 指 令 
y $0000001C TRAPV 指 令 
8 $00000020 违反 特权 
3. 假设 你 有 两 个 模拟 数字 转换 器 ， 如 下 表 所 示 : 
转换 器 类 型 分 辩 率 (位 ) 时 钟 速 率 (MHz) 范围 (伏特) 
单 坡 16 1.00 0 到 +6.5535 


逐步 逼近 16 1.00 0 到 +6.5535 





ww 
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每 种 类 型 的 转换 器 要 数字 化 +1.5001V 的 模拟 电压 需要 多 长 时 间 (us) ? 


.假设 你 为 下 列 每 个 处 理 器 中 断 事件 赋予 了 从 0 (最 低 ) 到 7 (最 高 ，NMI) 的 优先 级 。 对 于 


下 列 每 个 事件 ， 赋 予 其 优先 级 ， 并 简要 描述 你 赋予 这 种 优先 级 的 原因 。 
a. 键盘 项 击 输 入 。 

b. 即将 到 来 的 电源 失效 。 

c. 监视 定时 器 。 

d. MODEM 有 要 读 的 数据 。 

e. A/D 转 换 器 有 新 的 数据 。 

f. 10ms 的 实时 时 钟 滴答 。 

g. 鼠标 点 击 。 

h. 机 器 人 的 手 已 经 接触 到 固体 表面 。 

i. 存储 器 奇偶 错误 。 


.假设 你 有 一 个 11 位 的 AD 转换 器 ， 能 对 从 -10.24V 到 +10.23V 范 围 的 模拟 电压 进行 数字 化 。 


AD 转换 器 的 输出 格式 是 正 数 的 2 补 码 还 是 负数 的 2 补 码 取决 于 模拟 输入 信和 号 的 正 负 。 

a. 模拟 输入 电压 的 变化 值 最 小 是 多 少 才能 保证 该 变化 被 检测 到 (〈 即 引起 数字 输出 值 变化 ) ? 
b. 表示 模拟 电压 一 5.11V 的 二 进 制 数字 是 什么 ? 

c. 假设 A/D 转 换 器 被 连接 到 一 个 具有 16 位 宽 数据 总 线 的 微 处 理 器 ， 则 对 于 十 8.96V 的 模拟 电 
压 ， 该 十 六 进 制 数字 是 什么 ”提示 : 没有 必要 将 11 位 的 数字 调整 为 16 位 。 

d. 假设 A/D 转 换 器 是 一 个 逐步 逼近 型 的 A/D 转 换 器 ， 则 在 最 终 对 模拟 电压 进行 数字 化 之 前 需 
要 多 少 个 样本 ? 

e. 假设 A/D 转 换 器 被 1MHz 时 钟 信号 所 控制 ,采样 发 生 于 每 个 时 钟 的 上 升 沿 ， 则 数字 化 一 个 
模拟 电压 需要 多 长 时 间 ? 


:假设 你 是 一 家 医学 电子 公司 的 首席 软件 设计 师 。 你 的 新 项 目 就 是 为 一 种 便携 式 心脏 监视 器 设 


计 一 些 关 键 算法 。 为 了 检验 你 的 算法 ， 你 将 用 一 些 基本 的 硬件 做 一 个 简单 的 实验 。 监 视 器 将 
采用 一 个 10 位 模拟 数字 转换 器 (A/D)， 输入 范围 是 0V 到 10V。0V 的 输入 电压 会 导致 
0000000000 的 二 进 制 输出 ， 而 10V 的 输入 电压 会 导致 1111111111 的 二 进 制 输出 。 每 200us 就 对 
模拟 信和 号 进行 一 次 数字 化 。 你 要 获得 一 些 数 据 ， 下 列 显示 的 就 是 数字 化 后 的 数据 值 (用 十 六 
进 制 显示 )。 | 
2C8, 33B, 398, 3DA, 3FC, 3FB, 3D7, 393, 334, 2BF, 23E, 1B8, 137, 0C4, 067, 025, 003, 004, 
028, 06C, 0CB, 140, 1C1, 247 
一 旦 你 收集 到 这 些 数据 ， 你 就 想 将 数据 写 到 带 状 记录 仪 并 显示 ， 使 得 医生 能 读 到 。 带 

状 记录 仪 的 输入 范围 是 一 2V 到 +2V。 幸 运 的 是 ， 你 的 硬件 工程 师 已 经 设计 了 一 个 10 位 数字 
到 模拟 (D/A) 电路 ， 使 得 0000000000 的 二 进 制 输入 值 产生 - 2V 的 模拟 输出 ， 而 
1111111111 则 产生 +2V 的 输出 。 你 写 一 个 将 数字 化 数据 发 送 到 记录 仪 的 简单 算法 ， 使 得 你 
能 了 解 是 否 一 切 工 作 正 常 。 

a. 通过 将 上 述 数据 描绘 在 图 纸 上 来 表明 记录 仪 会 输出 什么 。 

b. 波形 有 周期 吗 ? 如 果 有 ， 该 波形 的 周期 和 频率 是 多 少 ? 


. 假设 你 有 一 个 14 位 的 逐步 逼近 式 的 AID 转换 器 ， 转 换 时 间 是 25kus。 


a. 假设 你 想 在 未 知 波形 的 每 个 周期 内 最 少 收集 4 个 样本 ， 则 你 能 度量 的 交流 波形 的 最 大 频率 
是 多 少 ? 

b. 假设 转换 器 能 转换 从 一 5V 到 +5V 的 输入 电压 ， 则 转换 器 能 度量 的 最 小 电压 变化 是 多 少 ? 
c. 假 设 你 想 将 这 个 A/D 转 换 器 与 一 个 特定 的 采样 保持 电路 (S/H) 一 起 使 用 ,而 该 S/H 具有 每 





Sa 


ms1V 的 下 降 速率 。 那 么 ， 这 个 特定 的 S/H 电路 与 A/D 转 换 器 相 容 吗 ? 如果 不 是 ， 为 什么 ? 

8. 将 各 种 应 用 与 最 适合 它 的 A/D 转 换 器 相配 。 转 换 器 列举 如 下 ， 

A.28 位 逐步 逼近 AD 转换 器 ， 每 秒 2 个 样本 。 

B. 12 位 逐步 逼近 AD 转换 器 ，20us 的 转换 时 间 。 

C. 0~10kHz 的 电压 到 频率 转换 器 ，0.005% 的 精确 度 。 

D. 8 位 快 闪 转换 器 ，20ns 转 换 时 间 。 

a. 在 军事 研究 实验 室 中 进行 炮弹 冲击 波 测量 。 

b. 用 于 天 气 遥 测 的 通用 数据 记录 仪 。 

c. 7 数字 的 实验 室 用 电压 表 。 

d. 铸造 厂 的 熔 钢 温度 控制 器 。 ~ 
. 下面 是 一 列 C 语 言 函 数 原型 。 将 它们 以 正确 的 次 序 排列 ， 使 你 的 修 入 式 处 理 器 接口 到 一 个 8 


9 
通道 12 位 A/D 转 换 系统 。 
a. boolean Wait(int) / 真 = 做 完 ，int 定 义 了 超时 前 等 待 的 毫秒 数 ”*/ 
b. int GetData(void) 雍 返 回 数字 化 的 数据 值 */ 
c. int ConfidenceCheck(void) /* 执行 对 硬件 的 信任 检测 */ 
d. void Digitize(void) /* 打开 AD 转换 器 进行 数字 化 */ 


e. void SelectChannel(int) /* 选择 模拟 输入 通道 进行 读 */ 
f. void InitializeHardware(void) /* 将 硬件 状态 初始 化 到 一 个 已 知 的 状况 */ 
g.void SampleHold(boolean) ” /# 真 = 采样 ， 假 = 保持 */ 
10. 假设 你 有 16 位 D/A 转 换 器 ， 在 设计 上 类 似 于 图 12-12 所 示 。 最 低 有 效 数 据 位 D0 的 电流 源 产 
生 0.1 微 安培 的 电流 。 要 使 得 该 D/A 转换 器 的 满 刻度 是 10.00V， 所 需要 的 电阻 值 是 多 少 ? 
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学 习 目 标 

。 描 述 CISC 和 RISC 体 系 结构 的 基本 特征 ， 

。 解释 在 现代 计算 机 中 为 什么 要 使 用 流水 线 ， 

。 解释 流水 线 的 优点 及 其 产生 的 性 能 问题 ; 

。 描述 处 理 器 如 何在 一 个 时 钟 周 期 里 执行 多 条 指令 ， 

。 解释 编译 器 为 了 提高 系统 性 能 而 充分 利用 计算 机 体系 结构 的 一 些 方法 。 

目前 ， 微 处 理 器 的 速度 、 功 耗 、 功 能 和 成 本 都 跨越 了 很 大 的 范围 。 你 可 以 只 花 不 到 25 美 
分 就 买 一 个 4 位 的 微 控 制 器 ， 也 可 以 花 超过 1 万 美元 买 一 个 用 于 空间 计算 的 专用 处 理 器 。 现 在 
正在 使 用 的 微 处 理 器 就 有 超过 300 种 ， 我 们 如 何 区 分 如 此 种 类 繁多 的 处 理 器 呢 ? 而 且 ， 出 于 本 
书 的 目的 ， 我 们 这 里 将 不 考虑 大 型 计算 机 (IBM、VAX、Cray、Thinking Machines ， 等 等 )， 
而 是 将 我 们 的 讨论 局 限 在 微 处 理 器 这 个 范畴 。 

一 般 来 说 ， 现 今 使 用 的 微 处 理 器 系统 结构 主要 有 三 种 : CISC、RISC 和 DSP。 稍 后 我 们 将 
讨论 这 些 缩写 的 意思 ， 现 在 我 们 先 讨 论 一 下 如 何 区 分 这 么 多 种 器 件 ， 哪 些 因 素 能 确定 和 区 分 
出 不 同 的 类 别 。 首 先 让 我 们 试 着 来 确定 一 下 产生 各 种 配置 的 途径 : 

1. 时钟 速 度 : 目前 处 理 器 的 时 钟 速度 可 从 几乎 为 0 到 几 个 GHz。 对 于 现代 的 CMOS 电 路 设计 ， 
一 个 器 件 所 消耗 的 功率 通常 是 与 它 的 时 钟 频率 成 正比 的 。 如 果 你 希望 让 一 个 安装 在 鲸 色 浴 背 上 
的 微 处 理 器 使 用 一 个 AAA 电 池 维 持 运 行 两 年 ， 那 么 它 的 时 钟 频率 就 不 能 太 快 ， 比 较 好 的 做 法 是 
让 它 根本 不 运行 ， 而 仅仅 是 在 需要 它 做 一 些 有 用 事情 的 时 候 唤 醒 它 ， 然 后 再 让 它 继 续 休眠 。 

2. 总 线 宽度 : 我 们 还 可 以 通过 数据 通路 的 宽度 来 区 分 处 理 器 : 4 位 、8 位 、16 位 、32 位 、 
64 位 、VLIW ( 超 长 指令 字 )。 一 般 来 说 ， 如 果 总 线 的 宽度 扩大 一 倍 ， 处 理 一 个 算法 的 速度 会 
提高 2 到 4 倍 。 

3. 处 理 器 的 寻 址 空间 也 各 有 不 同 。 一 个 简单 的 微 控 制 器 可 能 只 有 1KB 的 寻 址 空间 ， 而 
Pentium、SPARC、Athlon 和 Itanium 系 列 的 机 器 有 几 个 GB 的 寻 址 能 力 。Freescale 公 司 的 
PowerPC 处 理 器 有 64 位 的 存储 器 寻 址 能 

4. 微 控制 器 / 微 处 理 器 /ASIC: 这 类 设备 能 称 为 严格 意义 上 的 CPU 吗 ， 璧 如 Pentium 或 者 
Athlon? 或 者 说 是 一 个 带 外 设 的 集成 化 CPU， 璧 如 68360? 又 或 者 说 是 一 个 加 密 的 Verilog 或 者 
VHDL 代 码 库 ， 璧 如 ARM7TDMI， 最 终 将 被 用 于 定制 的 集成 电路 设计 ? 

如 你 所 知 ， 我 们 还 可 以 通过 指令 集体 系 结构 (instruction set architecture, ISA) 来 区 分 处 
理 器 。 从 一 个 软件 开发 者 的 角度 来 看 ， 这 就 是 处 理 器 的 体系 结构 ，ISA 的 不 同 就 决定 了 特定 处 
理 器 所 适用 的 应 用 领域 。 在 本 书 中 我 们 已 经 学 习 了 Motorola 68K 的 ISA， 以 及 Intel x86 和 
ARM v4 的 ISA, 但 这 些 只 是 目前 正在 使 用 的 众多 不 同 的 ISA 的 三 种 。 其 他 的 例子 还 有 29K、 PPC.、 
SH、MIPS 以 及 各 种 DSP 的 ISA。 即 使 同一 种 ISA 内 也 可 以 有 超过 100 种 不 同 的 微 处 理 器 或 集成 
器 件 。 例 如 ，Motorola 公 司 的 微 处 理 器 系列 代号 为 680X0， 其 中 X 用 不 同 的 数字 替代 时 就 代表 
这 个 系列 中 一 个 型 号 。 如 果 我 们 在 一 个 型 号 为 68000 的 处 理 器 核 上 加 上 一 些 外 设 器 件 ， 它 就 变 
成 6830X 系 列 。 其 他 的 公司 也 有 类 似 的 分 类 策略 。 
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现代 的 处 理 器 在 时 钟 速度 上 的 跨度 也 很 大 ， 从 不 到 1MHz 到 超过 3GHz (3000MHz) 。 不 久 
以 前 ，CRAY 超 级 计算 机 花费 了 超过 一 百 万 美元 才 使 其 时 钟 速度 达到 前 所 未 有 的 1GHz。 为 了 
达到 这 个 速度 ，CRAY 的 工程 师 们 必须 要 构建 额外 的 、 带 有 滚 冷 设备 的 电路 板 ， 并 且 还 要 通 
过 变更 线路 的 长 度 来 控制 在 上 面 传输 的 信号 时 延 。 现 在 ， 我 们 大 部 分 人 桌 上 的 个 人 电脑 都 已 
经 达到 了 这 一 性 能 。 事 实 上， 我 写 这 本 书 时 用 的 PC 就 带 有 AMD Athlon 2.0GHz 的 CPU， 这 被 
认为 是 AMD 公 司 生产 的 第 三 代 产 品 。 如 果 这 本 书 出 版 得 成 功 ， 我 就 可 以 用 得 到 的 版 税收 入 来 
把 PC 升级 到 Athlon64 了 。 


13.1 处 理 器 体系 结构 ，CISC、RISC 及 DSP 


68K 处 理 器 及 其 指令 集 ，8086 处 理 器 及 其 指令 集 ， 这 两 者 都 属于 CISC， 即 复杂 指令 集 计 
站 机 体系 结构 。CISC 的 特点 是 指令 系统 大 、 寻 址 模式 多 。 你 很 可 能 已 经 见 过 许多 汇编 语言 也 
指令 ， 还 有 一 些 已 有 指令 经 过 变化 后 的 指令 。 而 且 ， 这 些 指令 执行 时 需要 的 时 钟 周期 数 有 很 
大 的 差异 。 如 下 表 所 示 ， 执 行 一 条 MOVE 指 令 时 ， 由 于 执行 方式 的 不 同 ， 需 要 的 时 钟 周期 数 最 
少 的 仅 为 8， 最 多 的 达 28。 





指 令 时 钟 周期 数 指令 执行 时 间 (hs) * 
MOVE.B #$FF, $1000 28 1.75 
MOVE.B D0, $1000 20 1.25 
MOVE.B D0, (A0) 12 0.75 
MOVE.B D0, (AO)+ 8 0.50 


* 假设 时 钟 周 期 为 16MHz。 

指令 执行 的 时 间 差 异 较 大 也 是 CISC 体 系 结构 的 特征 。CISC 指 令 集 可 以 非常 紧 竣 ， 因 为 一 
条 复杂 指令 能 做 多 个 操作 。 我 们 回忆 一 下 DBcc， 即 先进 行 条 件 判断 ， 然 后 递减 并 根据 条 件 进 
行 转移 ， 这 是 一 个 典型 的 CISC 指 令 。CISC 体 系 结构 又 称 为 冯 : 诺 依 时 体系 结构 (von 
Neumann architecture) ， 这 是 为 了 纪念 最 先 提出 这 一 结构 的 约翰 . 冯 : 诺 依 曼 。 下 面 我 们 就 来 
讨论 一 下 加: 诺 依 曼 体 系 结构 一 个 方面 的 问题 。 

CISC 处 理 器 往往 需要 大 量 的 电路 ， 在 集成 电路 的 硅 片 上 需要 占用 大 块 的 面积 ， 这 使 得 公 
司 在 试图 发 展 CISC 技 术 时 面临 两 个 问题 ， 较 高 的 成 本 和 较 慢 的 时 钟 速度 。 导 致 较 高 成 本 的 原 
因 是 集成 电路 的 价格 在 很 大 程度 上 是 由 制造 的 成 品 率 所 决定 的 ， 制 造成 品 率 度量 的 是 ， 从 通 
过 IC 制 造 过 程 的 每 个 硅 圆 片上 可 获得 多 少 个 好 的 芯片 (成品 率 )。 包 含 复杂 电路 的 大 芯片 与 小 
蕊 片 相 比 有 更 低 的 成 品 率 。 而 且 ， 复 杂 芯 片 很 难 提高 速度 ， 因 为 在 整个 芯片 区 域 上 分 配 和 同 
步 时 钟 是 一 个 有 难度 的 工程 任务 。 

一 个 具有 冯 . 诺 依 曼 体 系 结构 的 计算 机 只 有 一 个 存储 空间 ， 用 于 存放 指令 和 数据 ， 如 图 
13-1 所 示 。CISC 计 算 机 只 有 一 组 总 线 连接 CPU 和 存储 器 ， 指 令 和 数据 必须 共享 同一 条 数据 通 
路 从 存储 器 进入 CPU， 因 此 如 果 CPU 正 在 写 一 个 数据 值 到 存储 器 ， 它 就 不 能 读 取 下 一 条 要 执 
行 的 指令 ， 它 必须 要 等 到 数据 被 写 人 存储 器 之 后 才能 进行 操作 。 这 一 问题 被 称 为 站， 诺 依 曼 
瓶颈 (von Neumann bottleneck) ， 因 为 它 限 制 了 处 理 器 的 运行 速度 。 

哈佛 大 学 的 Howard Aiken 发 明了 哈佛 体系 结构 (他 肯定 是 太 谦 虚 了 所 以 设 有 用 他 自己 的 
名 字 来 命名 ) 。 哈 佛 体系 结构 的 特点 是 指令 和 数据 分 开 存 储 ， 这 样 就 能 够 独立 地 对 指令 和 数据 
进行 操作 。 哈 佛 体系 结构 和 冯 “ 诺 依 曼 体系 结构 还 有 一 个 微妙 的 差别 ， 后 者 允许 程序 自行 修 
改 代码 ,但 前 者 不 可 以 。 因 为 在 汉 : 诺 依 曼 体 系 结构 中 指令 代码 与 数据 位 于 同一 个 存储 空间 
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中 ， 所 以 一 条 指令 可 以 修改 代码 空间 中 其 他 部 分 所 存放 的 指令 。 而 在 哈佛 结构 中 ， 存 取 操 作 
只 能 在 数据 存储 器 中 进行 ， 自 行 修 改 代 码 是 非常 困难 的 。 

哈佛 体系 结构 通常 与 精 
简 指 令 集 计 算 机 (RISC) 







体系 结构 的 思想 是 相关 联 冯 . 诺 依 曼 CPU ! 线 、 数 据 总 线 
的 ， 但 是 你 肯定 可 以 用 哈佛 ;和 状态 总 线 
体系 结构 设计 CISC 计 算 机 。 
实际 上 ， 目 前 的 CISC 体 系 i 
结构 具有 分 开 的 片上 cache 指令 1 6 
存储 器 分 别 用 于 存储 指令 和 上 | 
数据 的 情况 是 相当 常见 的 。 i: 

哈佛 体系 结构 在 AMD 由 ; ;数据 空间 地 址 
(Advanced Micro Device) 了 er 


公司 生产 的 Am29000 RISC 


微 处 理 器 上 得 到 了 商业 化 
使 用 。 虽 然 Am29K 处 理 器 图 13-1 汉 ' 诺 依 曼 (CISC) 体系 结构 和 哈佛 


在 惠普 公司 的 首 批 LaserJet (RISC) 体系 结构 的 存储 器 体系 结构 


系列 打印 机 上 得 到 了 商业 化 的 使 用 ， 但 是 设计 者 们 很 快 就 向 AMD 抱 怨 基 于 29K 的 设计 成 本 太 
高 ， 因 为 需要 设计 两 个 完全 独立 的 存储 空间 。 为 此 ，AMD 公 司 的 后 继 处 理 器 都 采用 了 单 存储 
空间 来 存储 指令 和 数据 ， 这 样 也 就 放弃 了 哈佛 体系 结构 的 优势 。 然 而 ， 就 像 我 们 很 快 就 要 看 
到 的 ， 哈 佛 体系 结构 在 很 多 具有 片上 指令 和 数据 cache 的 现代 微 处 理 器 中 还 是 生存 下 来 了 。 今 
天 ， 要 实现 ARM 处 理 器 既 可 以 使 用 冯 诺 依 曼 体系 结构 ， 也 可 以 使 用 哈佛 体系 结构 。 

在 20 世 纪 80 年 代 早期 ， 很 多 研究 者 都 在 探究 通过 流水 线 技 术 来 提高 微 处 理 器 的 性 能 ， 而 
不 是 把 指令 集 做 得 越 来 越 复杂 '" ?。 根 据 Resnicks 的 讲述 ， 早 在 60 年 代 未 期 ，Thornton4 在 设计 
CDC 6600 计 算 机 时 就 已 经 研究 了 RISC 体 系 结构 的 某 些 方面 。 那 些 从 事 RISC 计 算 机 研究 的 计 
算 机 科学 家 进行 了 早期 的 研究 ， 这 些 研究 涉及 指令 集中 的 哪些 部 分 是 编译 器 设计 者 和 高 级 语 
言 实际 要 用 到 的 。 在 一 项 研究 中 5 研究 者 发 现 ， 在 所 有 执行 的 指令 中 ，10 条 指令 占 了 总 数 的 
80%， 而 仅仅 30 条 指令 就 占 了 总 数 的 99%。 这 样 ， 研 究 者 所 发 现 的 就 是 ， 在 绝 大 部 分 时 间 ， 只 
有 少数 的 指令 和 寻 址 模式 是 真正 要 用 到 的 。 直 到 那 时 ，ISA 的 广度 和 复杂 性 都 是 CPU 设计 者 们 
所 自豪 的 ， 会 有 “我 的 指令 集 比 你 的 指令 集 大 ” 等 等 之 类 的 竞争 。 

Patterson 和 Ditzel 在 他 们 的 论文 引言 中 提 到 ; 

也 许 这 种 复杂 性 的 增加 对 于 提高 新 模型 的 成 本 效益 有 积极 的 作用 ， 但 本 文 认为 ， 

这 一 倾向 并 不 总 是 划算 的 ， 实 际 上 甚至 很 可 能 带 来 的 害处 比 好 处 还 要 多 一 些 。 我 们 

将 给 出 RISC 结 构 与 CISC 结 构 同 样 经 济 有 效 的 例子 。 

为 了 寻求 越 来 越 复 杂 和 优雅 的 指令 和 寻 址 模式 ，CPU 设 计 者 们 设计 了 越 来 越 复杂 的 CPU， 
这 种 复杂 性 反而 过 制 了 CPU 的 发 展 。 科 学 家 们 开始 思考 :“ 假 设 我 们 只 留 下 最 最 必需 的 指令 和 
寻 址 模式 ， 而 把 其 他 的 统统 去 掉 。 简 化 后 不 可 避免 地 会 使 得 程序 的 代码 量 增加 ， 这 样 做 是 否 
值得 呢 ?” 

答案 绝对 是 肯定 的 。 如 今 RISC 已 经 成 为 主流 的 体系 结构 ， 原 因 是 RISC 的 好 处 远 远 超过 了 
SISC， 即 使 代码 量 可 能 要 增加 1.5 到 2 倍 ， 但 速度 的 提高 以 及 全 流水 线 的 设计 远 超过 这 些 代价 。 
现代 的 RISC 处 理 器 能 够 在 一 个 时 钟 周期 内 运行 多 条 指令 ， 称 为 超标 量 休 系 结构 (superscalar 
architecture) 。 当 我 们 考察 流水 线 时 ， 我 们 就 会 了 解 这 一 奇迹 是 如 何 实现 的 。 最 初 的 RISC 设 计 
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往往 采用 哈佛 结构 ， 但 随 着 cache 的 增 大 ， 设计 者 们 也 就 只 设置 单个 的 外 部 存储 空间 了 。 

然而 ， 事情 并 没有 这 么 简单 ， 一 些 现代 RISC 设 计 的 ISA (如 PowerPC) 已 经 变 得 和 CISC 处 
理 器 一 样 复杂 了 。 而 朋 ，CISC 体 系 结构 和 RISC 体 系 结构 的 某 些 方 面 一 直 在 相互 融合 ， 要 在 它 
们 之 间 划 一 条 明确 的 界限 已 不 容易 。 例 如 ， 现 代 的 Pentium 和 Athlon CPU 所 执行 的 ISA 是 从 Intel 
经 典 的 x86 CISC 体 系 结构 所 演化 而 来 的 ， 但 是 ， 从 它们 内 部 所 表现 出 来 的 却 是 RISC 处 理 器 的 特 
性 。 而 且 ，Intel 和 AMD 引 领 着 速度 的 提高 ， 目 前 3GHz 以 上 的 处 理 器 都 是 Athlon 和 Pentium 的 。 

RISC 和 CISC 都 能 完成 工作 ， 虽 然 RISC 处 理 器 非常 快速 和 高 效 ， 但 由 于 提供 给 编译 器 的 指 
令 较 少 ， 所 以 RISC 处 理 器 的 执行 代码 趋向 于 更 大 。 尽 管 这 种 差别 在 迅速 减 小 ，CISC 计 算 机 还 
是 更 多 地 倾向 于 被 使 用 在 控制 应 用 中 ， 如 工业 控制 器 、 仪 器 控制 器 等 等 。 

另 一 方面 ，RISC 计 算 机 则 被 广泛 应 用 于 数据 处 理 的 应 用 领域 ， 一 般 主 要 做 这 样 的 事情 : 

数据 输入 >>> 数据 处 理 >>> 数据 输出 

RISC 处 理 器 因 其 指令 简化 、 高 速 ， 非 常 适合 于 注重 数据 移动 的 算法 ， 比 如 用 于 远程 通信 和 游 
戏 的 算法 。 

数字 信号 处 理 器 (digital signal processor, DSP) 是 对 数据 进行 数学 数据 处 理 的 一 类 专用 
处 理 器 。DSP 进 行 数 学 运算 ， 它 不 进行 控制 (CISC) 或 者 数据 处 理 (RISC)。 传 统 上 ，DSP 
是 典型 的 CISC 处 理 器 ， 它 带 有 若干 个 增强 部 件 来 加 速 特殊 数学 运算 的 执行 。 这 些 部 件 都 是 硬 
件 电 路 ， 璧 如 在 前 面 讨 论 过 的 ARM 乘 法 器 模块 中 的 桶 型 移 位 器 和 乘法 /累加 (MAC) 指令 
( 见 图 11-2)。 回 想 一 下 内 循环 的 过 程 : 

。 取 常量 X 和 变量 Y 

。 两 数 相 乘 ， 并 累加 (SUM) 结果 

。 判断 循环 是 否 结束 

DSP 用 一 条 指令 就 能 实现 CISC 处 理 器 需要 8 条 或 更 多 条 指令 才能 完成 的 工作 。 回 忆 一 下 积 
分 知识 ， 我 们 知道 求 一 个 函数 的 积分 等 价 于 求 它 对 应 的 曲线 与 X 轴 之 间 的 面积 。 要 求 出 这 个 面 
积 ， 可 以 在 曲线 上 每 隔 一 小 段 向 X 轴 做 一 个 很 小 的 和 矩形， 最 后 把 所 有 算 形 的 面积 累加 起 来 。 这 
就 是 DSP 的 一 个 MAC 指 令 。 

求解 积分 在 求解 许多 数学 方程 和 实时 数据 转换 中 都 是 很 重要 的 一 个 部 分 。 一 般 DSP 的 主要 工 
作 是 从 A/D 转 换 器 接收 数据 流 ， 对 数据 流 进行 操作 ， 再 将 数据 传 给 D/A 转换 器 。 图 13-2 显 示 了 一 
个 连续 变化 的 信号 通过 A/D 转 换 器 后 进入 DSP， 经 DSP 处 理 后 又 传 给 了 D/A 转换 器 。 这 个 过 程 中 
DSP 要 对 数据 流 进行 实 时 处 理 ， 模 拟 信 号 被 转换 为 数字 信号 ， 经 过 处 理 后 又 被 转化 为 模拟 信号。 

连续 变化 连续 变化 
的 信号 的 信和 号 






图 13-2 DSP 对 连续 数据 的 处 理 


DSP 已 有 一 些 很 好 的 应 用 ， 首 当 其 冲 的 就 是 PC 机 上 的 调制 解 调 器 和 声卡 。 在 PC 机 出 现 之 
前 ，DSP 属 于 专用 设备 ,大 都 局 限于 军事 或 者 CIA 之 类 的 应 用 。 现 在 如 果 你 参加 一 个 电话 会 议 ， 
并 在 会 议 上 使 用 话 简 发 过 言 ， 那 你 就 一 定 已 经 使 用 了 DSP 进 行 处 理 。 如 果 没 有 DSP，、 那 将 会 有 [357 
令 人 烦恼 的 回音 和 反馈 造成 的 刺耳 声 。DSP 在 这 里 进行 了 消除 回音 的 操作 ， 并 在 你 说 话 的 时 
候 实 时 地 消除 反馈 。DSP 在 我 们 日 常生 活 中 的 最 新 应 用 是 数码 相机 ， 这 些 设备 里 面 有 着 很 多 
复杂 的 DSP， 能 够 处 理 一 个 3 到 8 百 万 像素 的 图 像 ， 可 以 在 短 短 的 数秒 钟 内 将 原始 图 片 转化 为 
一 个 压缩 的 jpeg 格 式 的 图 片 。 
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13.2 流水 线 简介 


在 讨论 流水 线 之 前 ， 我 们 先 回顾 一 下 CISC 和 RISC， 它 们 与 流水 线 技术 有 着 重要 的 联系 。 
当然 ， 我 们 需要 明确 一 下 我 们 这 里 说 的 流水 线 是 指 什么 。 在 某 种 意义 上 而 言 ， 流 水 线 是 计算 
机 里 一 个 必要 的 恶魔 。Turleys 提 到 

处 理 器 有 许多 事情 要 去 做 ， 但 这 些 事情 大 都 不 会 在 一 个 时 钟 周 期 内 究 成 。 执 行 

一 个 命令 需要 从 存储 器 中 取 指 令 、 译 码 、 存 取 操 作 数 和 结果 ， 进 行 位 移 、 加 法 、 条 

法 运算 以 及 其 他 任何 程序 要 求 的 操作 。 一 种 解决 方案 是 降低 CPU 的 时 钟 频率 ， 直 到 

它 能 够 在 一 个 时 钟 周 期 内 能 完成 所 有 的 工作 ， 但 是 显然 没有 人 会 喜欢 这 种 做 法 。 流 

水 线 技术 就 是 要 在 CPU 必 须 完成 的 工作 量 和 完成 这 些 工作 需要 的 时 间 这 两 者 之 间 找 

到 一 个 平衡 。 

让 我 们 讨论 得 更 加 深入 一 些 。 回 顾 可 知 逻 辑 门 (与 、 或 、 非 ) 及 由 这 些 逻 辑 门 构成 的 更 
大 的 电路 模块 都 属于 电子 电路 ， 一 个 信号 从 某 个 电路 的 输入 传输 到 输出 需要 花费 一 定 的 时 间 。 
信号 经 过 的 门 越 多 ， 传 输 的 延迟 也 就 越 大 。 

如 图 13-3， 这 是 一 个 有 着 8 个 输入 、3 个 输出 的 
复杂 功能 模块 。 我 们 可 以 假设 在 模块 里 进行 了 某 种 
类 型 的 字 节 处 理 。 我 们 假定 在 电路 中 每 一 个 功能 模 
块 的 传输 延迟 是 Xns。 这 个 模块 可 能 是 一 个 简单 的 
门 ， 也 可 能 是 一 个 更 复杂 的 功能 模块 ， 但 这 里 为 了 
讨论 方便 ， 我 们 假定 每 个 模块 的 延 时 是 相同 的 。 

同样 ， 我 们 还 假设 ， 通 过 对 这 个 电路 的 分 析 8 器 
得 出 从 输入 b 到 输出 Z 的 路 径 是 该 电路 的 最 长 路 图 13-3 通过 一 系列 功能 模块 的 传输 延迟 
径 。 换 句 话 说 ， 从 输入 端 b 必 须 通 过 N 个 门 才 能 到 达 输 出 端 z。 因 此 ， 不 管 在 什么 情况 下 ， 从 a 到 
h 的 一 组 新 输入 进入 电路 时 ， 必 须要 等 到 输入 端 b 的 信号 最 终 到 达 输出 端 Z 时 ， 我 们 才 认 为 电路 
是 稳定 ， 这 时 在 输出 端 X、Y、Z 上 的 数据 才 是 正确 的 。 

如 果 每 个 功能 模块 的 传输 延 时 都 是 Xns， 那 么 通过 该 电路 的 最 大 传输 延 时 为 N x Xns。 这 
里 我 们 给 出 一 个 实际 的 数据 。 令 X=300ps (30 x 10-5 秒 ) ，N=6， 则 传输 延迟 为 1800ps 
(1800ps) 。 如 果 该 电路 是 某 同步 数字 系统 中 的 一 部 分 ， 这 个 系统 由 一 个 时 钟 驱 动 ， 而 且 我 们 
希望 系统 能 够 在 一 个 时 钟 周期 内 完成 所 有 任务 ， 那 么 这 个 系统 可 以 设 定 的 最 大 时 钟 速率 为 ， 
(1/1800ps) = 556MHz。 

请 记 住 整个 计算 机 的 最 高 运算 速度 将 取决 于 这 一 条 电路 路 径 。 那 么 我 们 如 何 来 提高 计算 
机 的 速度 呢 ? 有 如 下 一 些 方案 可 以 选择 : 

1. 通过 改进 到 较 快 的 IC 制作 工艺 来 降低 传输 延 时 ， 

2. 减少 信号 传输 路 径 上 的 门 数 量 ， 

3. 解雇 硬件 设计 师 ， 雇 佣 技术 更 好 的 设计 团队 ， 

4. 使 用 流水 线 技术 。 

上 面 这 些 选项 都 是 我 们 通常 考虑 的 一 些 做 法 ， 但 通常 开发 团队 会 选择 第 4 种 方案 ， 高 层 管 
理 者 则 会 选择 第 3 种 方案 。 现 在 我 们 来 研究 一 下 第 4 种 方案 ， 如 图 13-4， 系 统 的 每 一 级 有 3 个 模 
块 的 传输 延迟 ， 即 900ps。 当 然 ， 为 了 稳当 可 靠 我 们 还 要 加 上 D 型 寄存 器 的 传输 延迟 ， 这 是 必 
要 的 一 部 分 代价 。 假 设 在 时 刻 t= 0， 有 一 个 时 钟 上 升 沿 ， 数 据 到 达 了 输入 端 a 到 h。 经 过 900ps 
之 后 ， 稳 定 的 中 间 信号 出 现在 第 一 个 D 触 发 寄存 器 的 输入 端 D0 到 D10。 之 后 一 个 新 的 时 钟 沿 到 
达 ， 数 据 就 会 通过 D 触 发 寄存 器 ， 经 过 一 定 的 传输 延迟 后 信号 到 达 D 触 发 寄存 器 的 输出 端 Q0 到 
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Q10。 这 样 经 过 900ps 十 t。( 寄 存 器 的 传输 延迟 ) 后 ， 数据 将 会 通过 流水 线 的 第 二 级 ， 稳 定 地 
出 现在 第 二 个 D 触 发 寄存 器 的 输入 端 。 在 下 一 个 时 钟 沿 到 达 后 数据 就 会 通过 第 二 个 D 触 发 器 ， 
电路 的 最 终结 果 就 出 现在 输出 端 和 、Y 和 Z。 





图 13-4 数字 电路 的 两 级 实现 。 通 过 每 级 的 传输 延迟 从 6 个 门 延迟 降低 到 3 个 门 延迟 


我 们 把 这 个 例子 再 简化 一 下 ， 假 设 通过 D 寄 存 器 的 传输 延迟 为 0， 这 样 就 只 需要 考虑 在 两 
级 中 的 功能 模块 的 传输 延迟 。 在 这 种 情况 下 ， 新 的 数据 通过 两 级 流水 线 到 达 输出 端 仍然 需要 
1800ps。 但 是 ， 这 与 非 流水 的 情况 相 比 存在 一 个 很 大 的 差异 。 那 就 是 在 每 次 时 钟 上 升 沿 的 时 
候 我 们 都 可 以 输送 新 的 数据 到 第 一 段 的 输入 端 ， 因 为 我 们 使 用 了 D 寄 存 器 来 进行 中 间 信 号 的 存 
储 和 同步 ， 这 样 在 第 一 个 流水 段 处 理 新 的 信息 时 第 二 个 流水 段 仍然 能 够 处 理 之 前 的 输入 数据 。 

因此 ， 尽 管 在 处 理 头 一 个 数据 时 使 用 流水 线 需要 花费 的 时 间 没 有 改善 (在 这 个 例子 中 是 
两 个 时 钟 周期 )， 但 是 每 一 个 接 下 来 的 时 钟 周期 在 输出 端 (X、Y 和 Z) 都 会 有 结果 输出 ， 不 再 
需要 两 个 周期 。 | 

我 们 在 第 11 章 中 讨论 过 ARM 的 指令 集体 系 结构 ， 这 个 体系 结构 与 ARM7TDMI 内 核 有 紧密 
关联 ， 这 个 内 核 的 CPU 设计 有 一 个 3 级 流水 线 。ARM9 有 一 个 5 级 流水 线 。 见 图 13-5。 


情况 1 





图 13-5 ARM7 和 ARM9 ceg 帮 梳 的 证 六 荐 休 系 天 相 


在 取 指 令 阶段 ， 指 令 被 从 存储 器 中 取出 来 。 在 译 码 阶 段 ，32 位 的 指令 字 被 译 码 ， 确 定 了 指 
令 序列 。 在 执行 阶段 ， 指 令 被 运行 ， 相 应 的 结果 被 写 回 到 寄存 器 。ARM9TDMI 的 内 核 采 用 了 5 
级 流水 。 增 加 的 两 级 分 别 为 存储 和 写 回 ， 它 们 使 得 ARM9 的 指令 吞吐 量 比 ARM7 大 概 提高 了 
13%7。 其 中 的 原因 就 体现 了 多 级 流水 线 设计 的 优势 。 在 ARM7 中 ， 执 行 阶段 需要 做 三 件 事 情 : 

1. 读 取 源 寄存 器 

2. 执行 指令 

3. 把 结果 写 回 到 寄存 器 

在 ARM9 的 设计 中 ， 寄 存 器 在 译 码 段 读 取 。 执 行 段 只 进行 指令 的 执行 操作 ， 再 由 回 写 段 把 
结果 写 入 到 目的 寄存 器 里 。 存 储 段 是 ARM9 中 一 个 独特 的 流水 段 ， 在 ARM7 中 没有 与 之 对 应 的 
部 件 ，ARM7 只 支持 单一 的 存储 空间 来 存放 指令 和 数据 。 当 取 一 条 新 的 指令 时 ， 不 能 同时 进 
行 数据 的 存 取 操作 ， 因 此 ， 在 出 现 冲 突 时 流水 线 必须 等 待 存 取 操 作 或 者 取 指令 操作 结束 。 这 
就 是 冯 . 诺 依 曼 体 系 结构 的 瓶颈 。ARM9 采 用 了 数据 和 指令 分 开 存储 的 方式 ， 在 存储 段 ， 存 
取 操 作 能 够 与 第 1 段 中 的 取 值 操作 同时 进行 。 


Ww 
\D 
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到 目前 为 止 ， 我 们 讨论 的 流水 线 技术 都 是 与 提高 速度 相关 。 为 了 提高 处 理 器 的 速度 ， 我 们 需 
要 做 的 事情 就 是 让 流水 线 的 每 一 段 具有 更 细 的 粒度 ， 这 样 我 们 就 可 以 提高 时 钟 的 频率 。 然 而 ， 基 
于 这 种 思想 设计 的 处 理 器 也 存在 一 个 问题 。 实 际 上 ， 有 很 多 艾 在 的 冒险 情况 会 使 得 流水 线 不 能 达 
到 最 佳 的 效率 。 例 如 在 ARM7 结 构 中 ， 如 果 遇 到 一 条 分 支 语 句 ， 发 生 了 转移 ， 那 么 我 们 怎么 办 呢 ? 
本 来 在 转移 指令 后 面 的 两 条 指令 已 经 进入 了 流水 线 ， 但 是 由 于 发 生 了 转移 它们 全 都 无 效 了 。 换 句 
话说 ,我 们 只 能 清空 (flush) 流水 线 ， 从 转移 指令 的 目标 地 址 处 重新 开始 读 取 指令 放 入 流水 线 。 

回忆 一 下 图 13-4， 第 一 个 新 的 数据 通过 流水 线 得 到 结果 需要 两 个 时 钟 周 期 。 设 想 一 下 一 
个 3 级 流水 的 设计 ， 如 ARM7， 从 转移 指令 结束 到 其 转移 到 的 那 条 目标 指令 执行 结束 需要 花费 
3 个 时 钟 周期 。 每 次 跳 转 时 就 会 出 现 这 种 情况 ， 需 要 等 待 额 外 一 些 时 钟 周期 ， 这 将 降低 流水 线 
的 吞吐 量 。 由 于 大 多 数 程序 平均 每 5 到 7 条 指令 中 就 有 一 条 转移 指令 ， 如 果 这 样 的 转移 发 生 的 
比较 多 ， 系 统 的 速度 将 会 变 慢 。 现 在 考虑 一 下 7 或 9 级 流水 的 情况 ， 每 一 次 非 顺序 的 读 取 指令 
对 处 理 器 代码 流 的 高 效 运行 都 是 一 种 潜在 的 阻碍 。 

我 们 将 会 在 这 一 章 的 后 面 讨 论 一 些 解决 这 个 问题 的 方法 ， 但 是 现在 我 们 只 需要 了 解 到 流 
水 线 体系 结构 并 不 是 像 我们 想像 中 的 那么 完美 。 最 后 ， 在 我 们 继续 讨论 之 前 ， 先 做 一 点 点 小 
节 收 尾 工作 。 首 先 ， 重 要 的 一 点 是 流水 线 不 一 定 要 与 整个 CPU 的 时 钟 频 率 相同 。 换 句 话说 ， 
我 们 可 以 用 一 个 分 频 电 路 产生 一 个 新 的 时 钟 ， 其 频率 只 有 系统 时 钟 周期 的 114。 然 后 我 们 用 这 
个 慢 的 时 钟 去 控制 流水 线 ， 而 较 快 的 系统 时 钟 则 用 来 在 每 一 段 流水 内 控制 状态 机 的 运作 。 其 
次 ， 在 程序 的 正常 执行 过 程 中 ， 某 一 阶段 的 操作 也 很 有 可 能 会 导致 流水 线 停 止 运行 。 存 储 器 
里 存 取 数据 或 者 取 指 令 等 等 往往 会 比 内 部 操作 花费 更 长 的 时 间 ， 因 此 每 次 外 存 操作 都 很 容易 
导致 流水 线 暂 停 一 到 两 个 时 钟 周期 。 

让 我 们 回 到 之 前 讨论 的 体系 结构 ， 看 看 简单 的 、 无 流水 线 的 情况 。 首 先 ， 我 们 必须 意识 
到 处 理 器 是 一 个 比较 昂贵 的 资源 ， 正 如 一 个 贵重 的 机 器 一 样 ， 应 该 尽量 让 它 保持 忙碌 的 状态 。 
空闲 的 处 理 器 是 对 空间 、 能 量 、 时 间 等 的 浪费 ， 我 们 需要 找到 一 个 方法 来 提高 性 能 。 为 了 弄 
清楚 这 个 问题 , 我 们 先 来 看 看 一 个 处 理 器 (如 68K) 是 如 何 执行 一 条 简单 的 驻 留 内 存 的 指令 的 ， 
如 . MOVE.W S$XXXX, S$YYYY 

根据 68K 处 理 器 的 程序 员 手 册 ， 这 条 MOVE.W 指 令 需要 40 个 时 钟 周期 才能 执行 完成 ， 而 该 
处 理 器 中 指令 执行 需要 的 最 少时 间 仅 为 7 个 时 钟 周期 ， 那么 多 的 时 钟 周期 到 底 花 在 了 什么 上 呢 ? 
如 图 13-6 所 示 为 其 执行 过 程 。 


时 间 


一 一 一 
产生 指令 地 址 所 需要 的 时 间 
从 存储 器 中 读 取 指令 所 需要 的 时 间 
对 操作 代码 进行 译 码 所 需要 的 时 间 
产生 操作 数 地 址 所 需要 的 时 间 
从 存储 器 中 读 取 操 作 数 所 需要 的 时 间 


执行 指令 所 需要 的 时 间 


写 回 结果 所 需 
| 要 的 时 间 







取 地 址 量 。 等待 译 码 _ 朋 , 取 地 址 是 ”等 待 执行 是 ”等 竺 


指令 执行 时 间 





图 13-6 68K 处 理 器 中 MOVE 指 令 的 执行 过 程 
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一 个 新 的 取 指 令 周 期 始 于 程序 计数 器 的 内 容 被 读 取 到 地 址 总 线 上 。 经 过 几 个 时 钟 周期 之 
存储 器 中 指定 位 置 的 指令 操作 代码 字 被 读 取出 来 。 

1. 处 理 器 对 指令 的 操作 代码 进行 译 码 。 

2. 产 生 第 一 个 操作 数 〈 源 地 址 ) 的 存储 器 地 址 。 

3. 从 存储 器 中 读 取 源 地 址 中 的 数据 。 

4. 从 存储 器 中 读 取 第 二 个 操作 数 (目的 地 址 )。 

5. 将 数据 写 入 到 目的 地 址 中 。 

在 这 些 活动 进行 时 ， 处 理 器 的 其 他 大 部 分 功能 模块 都 处 于 闲置 状态 。 由 此 可 以 看 出 ， 流 
水 线 技术 的 另 一 个 潜在 的 优势 在 于 把 这 些 工作 划分 成 几 个 小 任务 (级 ) 来 完成 ， 使 得 CPU 的 
资源 得 到 最 大 限度 的 利用 。 这 与 在 装配 线 上 生产 汽车 的 思想 完全 相同 。 执 行 每 一 条 指令 需要 
的 总 时 间 是 不 变 的 ， 但 是 我 们 不 用 每 次 都 等 40 个 时 钟 周期 才 得 到 下 一 条 指令 的 结果 。 正 如 我 
们 在 ARM 处 理 器 中 所 看 到 的 ， 假 设 我 们 没有 重 置 流 水 线 ， 那 么 下 一 条 指令 只 需要 完成 最 后 一 
级 流水 就 可 以 输出 结果 。 我 们 所 提高 的 是 整个 系统 的 吞吐 量 (throughput)。 

如 图 13-7， 假 设 洗 完 一 桶 衣服 总 共 需 要 2 个 小 时 的 时 间 ， 其 中 包括 4 个 步骤 (洗涤 、 甩 干 、 
折合 和 打包 )， 那 么 我 们 串 行 地 洗 4 桶 衣服 的 话 总 共 需 要 花 8 个 小 时 。 然 而 ， 如 果 我 们 把 任务 重 
县 起 来 的 话 ， 例 如 一 桶 衣服 洗涤 完毕 ， 下 一 桶 衣服 立刻 开始 洗 淋 ,这样 总 共 只 需要 花费 3 个 半 
小 时 (而 不 是 8 小 时 ) 的 时 间 就 能 洗 完 4 桶 衣服 。 


HT 





任务 顺序 ss “任务 品行 完成 
AL 人 . 洗 完 4 桶 衣服 所 需 总 时 间 
B 位 人 Tiota =4xTA 
C ~ 人 
D 









I 6PM 7 12 1 2AM 
村 | - 
me 
顺序 。 
^ Eom 流水 线 ; 
e “ 己 合 昌明 当 任 务 A 使 用 的 资源 洗衣机) 空闲 时 ， 
ee 就 开始 做 任务 B 


图 13-7 洗衣 流程 : 串 行 任务 执行 与 重 登 任务 执行 的 比较 。 由 Patterson 和 Hennessy 提供 


一 条 指令 的 执行 可 以 看 成 一 个 有 着 一 定 逻 辑 顺 序 的 物理 过 程 ， 它 能 被 分 解 为 一 系列 更 细 
的 步骤 。 以 三 级 过 程 为 例 ， 没 有 流水 线 的 情况 下 处 理 步骤 为 : 

1. 做 第 一 件 事情 ， 

2. 做 第 二 件 事 情 ， 

3. 做 第 三 件 事 情 ， 

4. 给 出 结果 ， 

5. 回 到 第 一 步 。 

采用 流水 线 技 术 后 ， 处 理 过 程 变 为 : 

1. 做 第 一 件 事情 ， 并 为 第 二 步 的 执行 保存 结果 ， 
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2. 获得 第 一 步 的 结果 ， 并 做 第 二 件 事 情 ， 为 第 三 步 的 执行 而 保存 结果 ， 

3. 获得 第 二 步 的 结果 ， 开 始 做 第 三 件 事情 ; 

4. 给 出 结果 ， 

5. 回 到 第 一 步 。 

现在 我 们 看 一 下 3 级 流水 线 的 执行 过 程 ， 如 图 13-8 所 示 。 由 于 第 1 级 的 硬件 在 完成 任务 后 

空闲 下 来 ， 所 以 我 们 可 以 设计 一 个 流水 线 。 这 样 ， 在 一 个 工作 没有 结束 前 我 们 就 可 以 在 第 1 级 

上 开始 执行 下 一 个 工作 。 我 们 把 第 一 个 工作 从 开始 执行 到 离开 流水 线 需 要 花费 的 时 间 称 为 流 
经 时 间 (flowthrough time) ,把 通过 流水 线 得 到 两 条 连续 的 结果 之 间 花 费 的 时 间 称 为 时 钟 周期 
时 间 (clock cycle time ) 。 


Ts。 = 每 级 的 执行 时 间 


流水 线 总 的 执行 时 间 = Te + 2x Ts 





图 13-8 将 处 理 过 程 分 解 为 流水 级 


可 以 看 出 ， 对 于 有 流水 线 的 情况 ， 执 行 3 条 指令 需要 花费 的 总 时 间 为 5 x T,。 在 没有 流水 线 的 
情况 下 ，3 条 指令 顺序 地 执行 将 会 需要 9 xT, 的 时 间 。 

现在 我 们 暂停 一 下 问 一 个 合理 的 问题 。 如 我 们 前 面 提 到 的 那样 ， 程 序 执行 时 平均 每 5~7 条 
指令 会 出 现 一 次 跳 转 。 也 就 是 说 JSR、BRANCH 或 者 JMP 指 令 会 以 较为 频繁 的 出 现 导 致 流水 线 
的 处 理 过 程 比 我 们 之 前 所 假设 的 情况 要 复杂 得 多 。 例 如 ， 在 图 13-8 中 如 果 第 一 条 离开 流水 线 
的 指令 是 BNE， 而 且 发 生 了 跳 转 ， 那 会 出 现 什么 情况 昵 ?这 是 一 个 不 易 回 答 的 问题 ， 在 本 书 
中 我 们 不 试图 去 解决 这 一 问题 。 然 而 ， 我 们 可 以 研究 一 下 影响 流水 线 效 率 的 一 些 因素 ， 对 处 
理 现实 系统 中 的 这 些 问题 给 出 一 些 通常 的 建议 。 

现在 我 们 考虑 这 个 问题 : 一 个 什么 样 的 体系 结构 有 助 于 我 们 设计 一 个 基于 流水 线 的 计算 
机 呢 ? 

。 所 有 指令 的 长 度 都 相等 ， 

。 只 有 少数 几 种 指令 格式 ， 

。 存储 器 操作 数 只 出 现在 load 和 store 指 令 中 ， 

。ALU 操 作 只 发 生 在 寄存 器 之 间 。 : 

什么 样 的 体系 结构 会 让 CPU 设计 者 们 想 辞 职 变 成 科罗拉多 州 Boulder 的 请 稽 演员 ? 

。 变 长 的 指令 

。 有 着 可 变 执 行 时 间 的 指令 

。 广泛 的 指令 和 寻 址 方式 
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。 既 有 寄存 器 操作 数 又 有 存储 器 操作 数 的 指令 

换 句 话说 ，RISC 处 理 器 易于 采用 流水 线 结构 ， 但 是 CISC 处 理 器 要 困难 很 多 。 但 并 不 是 说 
不 能 设计 一 个 基于 CISC 的 流水 线 ， 实 际 上 也 是 可 以 的 ， 只 不 过 要 在 传统 的 CISC 结 构 上 设计 一 
条 流水 线 非常 的 麻烦 。 例 如 ，AMD 64 位 系列 的 处 理 器 采用 了 12 级 流水 线 ， 其 中 有 5 级 专门 用 
来 对 x86 CISC 指 令 进 行 分 解 ， 以 使 得 它 能 在 流水 线 上 继续 进行 处 理 。 

现在 我 们 需要 考虑 一 下 其 他 的 影响 因素 ， 它 们 与 体系 结构 的 类 型 关系 不 大 ， 主 要 是 算法 
类 型 方面 的 影响 。 这 些 影 响 取 决 于 体系 结构 和 代码 流 互相 协作 的 优 劣 。 影 响 流 水 线 的 另外 三 
个 因素 是 : 

。 结构 的 影响 : 假设 我 们 只 有 一 个 存储 器 ， 在 流水 线 的 某 一 级 需要 读 取 一 个 操作 数 时 ， 

另 一 级 可 能 需要 读 取 一 条 指令 。 

。 控制 的 影响 : 我 们 需要 考虑 转移 指 会 。 

。 数 据 的 影响 : 某 条 指令 的 执行 依赖 于 前 面 某 条 指令 的 执行 结果 ， 但 是 那 条 指令 还 在 流 
水 线 上 执行 。 

我 们 看 看 ARM 体 系 结构 是 如 何 处 理 结构 影响 的 。 通 过 设置 两 个 独立 的 存储 空间 ， 维 护 独 
立 的 数据 存储 器 和 指令 存储 器 ， 数 据 的 读 取 和 指令 的 读 取 能 够 独立 地 同时 进行 。 转 移 语句 是 
难免 的 ， 我 们 怎么 来 减轻 转移 语句 带 来 的 损失 呢 ? 而 且 ， 流 水 线 的 规模 越 大 ， 转 移 语 名 产生 
的 影响 也 越 严 重 。 现 在 有 一 个 复杂 的 流水 线 ， 我 们 得 到 一 个 指令 序列 ， 正 在 流水 线 的 各 个 级 
中 进行 着 译 码 和 执行 等 任务 。 那 么 ， 往 往 会 碰 到 这 种 情况 ， 一 条 转移 指令 后 面 的 指令 已 经 在 
执行 或 几乎 执行 完毕 的 时 候 ， 处 理 器 发 现 需 要 进行 转移 。 

解决 该 问题 的 一 个 方法 是 分 支 预 测 (branch prediction)。 也 就 是 说 ， 让 CPU 通 过 学 习 具 备 一 
定 的 智能 来 预测 将 要 发 生 的 跳 转 。Turleys 就 提出 ， 研究 表明 在 碰 到 转移 指令 时 向 后 跳 转发 生 的 
可 能 性 比较 大 ， 而 向 前 跳 转 发 生 的 情况 比较 少 。 从 你 在 汇编 语言 习题 中 写 出 的 循环 语句 ， 你 可 
能 会 猪 到 这 个 原因 。 基 于 这 一 点 ， 当 CPU 过 到 一 个 转移 指令 时 ， 如 果 跳 转 的 自 的 地 址 比 当前 程序 
计数 器 的 地 址 要 小 ， 那 么 流水 线 就 自动 从 新 的 地 址 开始 装载 指令 。 如 果 目 的 地 址 比 当前 的 地 址 
大 ， 那 么 就 还 是 按照 正常 顺序 转载 。 当 然 这 不 会 总 是 一 帆 风 顺 的 ， 当 预测 失败 时 ， 流 水 线 必须 
清空 ， 然 后 从 正确 的 地 址 处 重新 开始 。 这 样 当 然 会 使 执行 的 速度 变 慢 ， 但 不 会 产生 严重 的 后 果 。 

解决 问题 的 另 一 个 方法 叫做 动态 分 支 预测 (dynamic branch prediction)。 假 设 处 理 器 维护 
了 很 多 个 小 型 的 二 进 制 计数 器 ， 即 2 位 的 计数 器 。 这 个 计数 器 最 小 值 为 00， 最 大 值 为 11。 最 小 
值 和 最 大 值 为 终 态 ， 即 饱和 态 。 当 计数 器 在 状态 00 时 ， 如 果 继 续 减 小 ， 状 态 仍 为 00。 同 样 ， 
在 状态 11 时 ， 如 果 继 续 增 大 ， 状 态 仍 为 11。 

4 个 状态 值 的 意义 分 别 为 : 

。00 = 强 不 接受 

。01 = 弱 不 接受 

。 10 = 弱 接 受 

。11 = 强 接受 

对 每 个 分 支 都 尽 可 能 设置 一 个 计数 器 与 之 相关 联 。 每 当 一 个 分 支 发 生 跳 转 ， 相 应 的 计数 
器 就 递增 ， 如果 没有 发 生 跳 转 计数 器 就 递减 。 这 样 分 支 预 测 逻 辑 就 能 根据 之 前 统计 的 结果 对 
跳 转 做 出 预测 。 显 然 ， 预 测 结 果 的 好 坏 取 决 于 计数 器 位 数 和 预测 电路 中 计数 器 的 个 数 。 

有 些 处 理 器 ， 例 如 AMPD 的 29K 系 列 采 用 了 一 个 专用 的 片上 高 速 缓 存 ， 称 为 分 支 目标 cache 
(branch target cache) 。， 用 于 存放 以 前 发 生 跳 转 的 前 4 条 指令 。 在 下 一 章 里 ， 我 们 将 更 深入 地 讨 
论 高 速 缓存 (cache) 问题 ， 但 是 现在 我 们 先 假定 已 经 有 一 个 硬件 实现 的 算法 ， 它 在 不 断 地 更 新 
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分 支 目标 cache 存 储 器 ， 加 入 最 近 访 问 的 分 支 ， 覆 盖 最 久未 访问 的 分 支 。 把 分 支 预测 机 制 和 分 支 
目标 cache 结 合 起 来 ， 处 理 器 就 能 够 降低 因 
为 指令 的 乱 序 执行 带 来 的 影响 。 

现代 的 RISC 处 理 器 几乎 和 相应 的 CISC 
结构 一 样 复杂 ， 但 正 是 RISC 的 指令 集体 系 
结构 使 得 它们 能 采用 流水 线 和 更 高 的 时 钟 
频率 来 获得 速度 的 提升 。 图 13-9 是 Freescale 
公司 (Motorola 的 前 身 ) 603e PowerPC 
RISC 处 理 器 的 结构 示意 图 。 

你 可 能 熟悉 这 个 处 理 器 ， 因 为 603e 被 用 
在 了 苹果 计算 机 的 Macintosh G 系 列 上 。603e 
是 超标 量 处 理 器 ,有 3 个 独立 的 指令 处 理 系 统 ， 
能 够 通过 独立 的 流水 线 并 发 地 执行 指令 。 

流水 线 体 系 结构 的 概念 也 引导 我 们 把 
计算 机 看 成 是 由 内 部 资源 、 流 水 线 和 控制 
系统 等 组 合 起 来 的 一 个 松散 的 系统 。 前 面 
提 到 的 PowerPC 603e 就 可 以 看 成 这 样 一 个 
系统 ， 它 与 68K 处 理 器 紧密 集成 的 体系 结构 人 
相当 不 同 。 虽 然 从 图 13-9 中 看 起 来 不 明显 ， ”图 13-9 PowerPC 603e RISC 处 理 器 。 来 自 Freescale 公 司 
但 我 们 可 以 把 处 理 器 画 成 图 13-10 的 样子 。 

每 一 条 指令 通过 流水 线 时 ， 控 制 系统 都 会 不 断 地 监视 可 用 来 执行 指令 的 可 得 到 的 资源 。 
这 就 好 比 去 自助 洗衣 店 洗 衣服 一 样 ， 洗 衣 店 里 有 多 个 洗衣 机 、 烘 干 机 和 县 衣服 的 桌子 。 如 果 
一 个 资源 在 使 用 中 ， 另 一 个 空间 ， 那 么 在 这 种 情况 下 ， 根 据 墨 菲 法 则 所 有 的 设备 要 么 在 使 用 
中 ， 要 么 就 是 坏 的 。 除 非 你 正在 忙 ， 没 功夫 去 用 。 








图 13-10 将 流水 线 处 理 器 看 作 资源 和 流水 线 的 集成 
如 果 我 们 需要 考虑 的 是 : “有 多 少 衣服 被 送 到 了 洗衣 店 , 单位 时 间 有 多 少 衣服 被 处 理 完毕 ”， 


那么 显然 洗衣 店 处 理 流 程 的 效率 要 比 某 一 个 人 在 家 里 洗 的 效率 要 高 得 多 。 当 然 ， 把 一 套 洗 衣 
设备 安装 在 洗衣 店 里 要 比 安装 在 家 里 花费 的 代价 还 是 要 大 一 些 。 





现代 夺 第 机 体 条 结构 疝 介 303 





把 指令 执行 的 部 件 分 割 成 各 种 资源 ， 然 后 在 这 些 资源 可 得 到 时 再 使 用 这 些 资源 ， 我 们 将 
这 个 过 程 称 为 动态 调度 (dynamic scheduling)。 处 理 器 中 有 各 种 复杂 的 硬件 来 执行 调度 的 任 
务 ， 这 些 硬件 都 试图 寻求 它们 所 能 执行 的 指令 。 在 某 些 情况 下 ， 它 将 尝试 不 按照 正常 顺序 来 
执行 指令 ， 它 可 能 会 假定 某 个 跳 转 不 会 发 生 ， 然 后 提前 执行 转移 语 名 后面 的 指令 。 我 们 把 这 
种 情况 称 为 投机 执行 (speculative execution ) 。 

关于 流水 线 的 效率 还 有 一 个 常常 被 忽视 的 方面 ， 就 是 支持 处 理 器 的 编译 器 的 效率 。 设 计 
CISC 处 理 器 的 初 囊 之 一 就 是 复杂 指令 能 够 使 编译 器 的 工作 变 得 容易 一 些 。 然 而 ， 事 实 上 并 非 
如 此 ， 因 为 编译 器 的 设计 者 往往 并 设 有 利用 那些 特殊 的 指令 。 

另 一 方面 ，RISC 体 系 结构 可 以 有 不 同 的 策略 。 编 译 器 对 处 理 器 吞吐 量 的 提高 担负 着 更 多 
的 责任 。 如 果 使 用 了 一 个 低 效 的 编译 器 ，RISC 体 系 结构 的 许多 优势 都 可 能 不 复 存 在 。 不 用 具 
体 说 ， 相 信 大 家 都 知道 有 一 个 商业 的 RISC 微 处 理 器 支持 3 个 独立 的 C++ 编译 器 ， 其 中 最 好 的 编 
译 器 性 能 是 最 差 的 那个 的 两 倍 。 也 就 是 说 ， 前 者 在 处 理 器 频率 只 有 后 者 一 半 的 情况 下 和 后 者 
的 效率 都 是 持平 的 ， 这 是 多 么 大 的 一 个 差距 。 

图 13-11 显 示 了 与 编译 器 相关 的 一 些 数据 。 这 些 数据 是 在 Intel x86 体 系 结构 的 PC 机 上 得 到 
的 ， 我们 可 以 看 到 即使 在 这 样 一 个 结构 上 编译 器 对 生成 代码 的 效率 影响 有 多 么 大 。 和 辟 如 说 
Dhrystone 测 试 基 准 ， 编 译 器 I 和 编译 器 C 的 性 能 就 相差 6 倍 。 对 此 感 兴趣 的 读者 可 以 去 查 一 下 
原始 的 资料 看 看 这 些 编译 器 和 厂商 的 名 字 到 底 是 什么 。 


Dhrystone 1,847,675 1,605,696 2,993,718 2,496,510 2,606,319 2,490,718 2,263,404 2,450,608 484,132 


time {ms) 
- Int2string a (sprintf()) 7642 5808 


Int2string b (STLSoft) ”3140 3207 

StringTok a (Boost) 4746 DNC 

StringTok b (STLSofi 636 280 

RectArr (1 iteration} 1082 997 

RectArr (10 iterations) 6922 5589 

zlib (small) 92 88 

zlib (large) 8412 ， 8847 ， ， 10,266 9117 





图 13-11 9 个 测试 基准 针对 x86 的 一 系列 编译 器 编译 后 的 执行 时 间 (ms )， 
黑体 字 为 最 好 的 结果 。 来 自 Wilson'? 

现在 我 们 来 研究 一 下 RISC 体 系 结构 的 一 些 特性 ， 以 及 这 些 特 性 与 流水 线 技术 的 关系 。 大 
部 分 的 RISC 处 理 器 都 具备 如 下 所 示 特 性 中 的 很 多 特性 : 

。 指 令 比 较 简单 。 

。 存 储 器 和 寄存 器 之 间 交 换 数据 只 能 通过 LOAD 和 STORE 指令 来 实现 。 

一 LOAD = 存储 器 到 寄存 器 

一 STORE = 寄存 器 到 存储 器 

。 所 有 的 算术 操作 都 是 在 寄存 器 之 间 进 行 的 。 

。 指 令 长 度 单一 。 

。 指 令 格式 唯一 或 者 很 少 。 

。 指 令 集 是 正 交 的 (没有 特殊 的 寄存 器 来 存放 地 址 和 数据 )。 

。 指 令 的 功能 几乎 没有 重合。 

。 寻 址 模式 单一 或 者 很 少 。 

。 几 乎 所 有 的 指令 都 是 在 一 个 时 钟 周期 内 完成 的 。 

。 主 要 针对 速度 进行 优化 。 

。RISC 处 理 器 可 能 会 有 很 多 个 寄存 器 。 
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一 AM29K 有 256 个 通用 寄存 器 

一 这 些 寄存 器 对 编译 优化 非常 有 用 ， 使 得 一 些 中 间 结 果 不 需要 写 到 外 存 

。 采 用 多 流水 线 技术 每 个 时 钟 周 期 能 够 执行 多 条 指令 。 

现在 , 绝 大 多 数 高 性 能 处 理 器 都 是 RISC 体 系 结构 。 下 面 是 一 些 现代 RISC 处 理 器 的 例子 : 

。 Motorola、IBM: PowerPC 8XX、 7XX、6XX、4XX | 

。 Sun: SPARC 

。 MIPS: RXXXX 

。ARM: ARM7、 ARM9 

。 HP: PA-RISC 

。 Hitachi: SHX 

直到 10 年 前 ， 计 算 机 专家 们 都 还 在 争论 RISC 和 CISC 的 优 缺 点 。 然 而 ， 从 那 时 起 RISC 体 系 
结构 已 经 在 性 能 比较 上 取得 了 胜利 。RISC 的 基本 硬件 体系 结构 更 简单 、 更 便宜 ， 速 度 更 快 。 
这 样 在 速度 上 的 提升 远 比 通过 增 大 指令 集 获 得 的 提升 大 得 多 。 而 且 对 编译 器 而 言 ， 实 现 RISC 
结构 的 编译 也 要 比 CISC 简 单 得 多 。 

现在 针对 Intel x86 体 系 结构 的 编译 技术 做 得 非常 完美 ， 因 为 其 编译 器 的 设计 者 们 
(Microsoft) 已 经 投 和 人 了 巨大 的 努力 使 得 它 与 RISC 一 样 高 效 。 我 们 都 知道 ， 在 RISC 体 系 结构 中 
引入 并 行 技 术 更 加 容易 。 由 于 指令 格式 单一 ， 流 水 线 技术 也 更 容易 预测 。 此 外 ， 现 在 的 应 用 程 
序 大 都 是 数据 密集 型 的 。 台 式 机 用 于 多 媒体 和 游戏 ， 工 作 站 用 于 数据 密集 型 的 应 用 ， 如 设计 和 
模拟 。 账 入 式 系统 则 用 于 游戏 (如 任天堂 ) 和 远程 通讯 应 用 (如 路 由 器 、 网 桥 、 交 换 机 )。 

Motorola 在 68060 时 停止 了 CISC 的 开发 , 并 取代 680X0 系 列 设计 了 两 个 新 的 RISC 体 系 结构 : 
ColdFire 和 PowerPC。AMD 停 止 了 586 的 研究 ，Intel 也 停止 了 最 初 的 Pentium 设 计 方 案 。AMD 
和 Intel 的 现代 处 理 器 都 融合 了 RISC 和 CISC 的 技术 ,而且 被 设计 成 能 够 兼容 以 前 的 Intel x86 指 
令 集 ， 并 通过 在 处 理 器 内 部 将 那些 指令 翻译 成 一 个 类 似 RISC 的 指令 序列 ， 体 系 结构 能 非常 迅 
速 地 处 理 这 些 指令 。 

现在 我 们 都 知道 ，RISC 处 理 器 使 用 流水 线 技术 来 加 速 指令 的 译 码 和 程序 的 执行 。RISC 结 
构 通常 不 容许 程序 自行 修改 代码 ， 也 就 是 通过 对 指令 空间 进行 写 覆 盖 来 修改 一 条 指令 。 纯 粹 
的 RISC 处 理 器 采用 哈佛 体系 结构 来 消除 指令 与 数据 共享 一 条 地 址 总 线 和 数据 总 线 而 带 来 的 
冯 “' 诺 依 曼 瓶 颈 问题 。 然 而 ， 大 多 数 先进 的 处 理 器 仍然 只 有 一 条 总 线 与 外 存储 器 相连 ， 不 过 
它们 采用 了 内 部 指令 和 数据 cache 来 替代 哈佛 体系 结构 。 

RISC 处 理 器 采用 众多 的 寄存 器 堆 来 降低 从 存储 器 到 寄存 器 的 延迟 。 这 些 寄存 器 用 于 广泛 
的 目的 ， 任 何 寄存 器 都 可 以 作为 一 个 间接 寻 址 的 存储 器 指针 。 此 外 ， 一 些 RISC 处 理 器 还 有 独 
立 的 浮 点 数 寄存 器 堆 。 所 有 的 RISC 处 理 器 都 有 独立 的 指令 译 码 和 指令 执行 单元 ， 很 多 甚至 还 
有 独立 的 浮 点 运算 单元 。 

RISC 处 理 器 常 采用 延迟 转移 (delayed branch) 技术 来 降低 转移 语句 带 来 的 影响 。 在 转移 
廷 时 档 (branch delay slot) 里 ，CPU 总 是 执行 指令 。 如 果 转 移 发 生 了 ， 指 令 就 被 取消 。 此 外 ， 
RISC 处 理 器 还 会 利用 编译 器 来 降低 装 入 一 使 用 惩罚 (load-use penalty)。 这 种 惩罚 之 所 以 会 产 
生 ， 是 由 于 操作 数 处 于 存储 器 中 的 操作 要 比 内 部 寄存 器 间 的 操作 需要 更 长 的 时 间 。 我 们 必须 
首先 取 来 存储 器 中 的 操作 数 ， 然 后 才能 使 用 它 。 这 就 出 现 了 问题 ， 假 设 我 们 在 做 一 个 算术 运 
算 ， 两 个 操作 数 相 加 得 到 一 个 结果 。 第 一 条 指令 从 存储 器 中 读 取 一 个 操作 数 放 入 寄存 器 ， 第 
二 条 指令 把 这 个 寄存 器 和 另 一 个 寄存 器 中 的 操作 数 相 加 得 到 一 个 结果 。 由 于 大 多 数 存储 器 操 
作 比 寄存 器 之 间 的 操作 要 花费 更 长 的 时 间 ， 所 以 流水 线 需要 等 待 至 少 一 个 时 钟 周 期 才能 把 数 
据 读 入 寄存 器 。 这 里 就 需要 编译 器 发 挥 作用 了 。 一 个 好 的 编译 器 应 该 知道 什么 时 候 需 要 进行 
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读 取 数据 的 操作 ， 把 这 个 操作 提前 进行 ， 使 得 在 运算 操作 执行 时 两 个 操作 数 都 已 经 被 读 取 到 
了 对 应 的 寄存 器 中 。 这 是 一 个 很 好 的 乱 序 执行 的 例子 。 当 然 ， 如 果 将 一 条 指令 提前 执行 会 破 
坏 算法 的 逻辑 流程 ， 我 们 就 不 能 这 么 做 了 。 

在 讨论 RISC 体 系 结构 对 性 能 的 提高 时 ， 我 们 不 能 不 提 针 对 RISC 体 系 结构 的 编译 技术 的 改 
进 。RISC 计 算 机 应 该 使 用 优化 的 编译 器 以 尽 可 能 地 利用 处 理 器 频率 高 的 特性 。 去 读 一 个 优化 
的 RISC 编 译 器 的 汇编 语言 输出 是 没有 任何 意义 的 ， 因 为 编译 器 通常 都 会 把 指令 重新 组 合 以 充 [368] 
分 利用 处 理 器 的 并 行 特性 。 这 些 编译 器 采用 的 技术 有 : 

“只 要 有 可 能 ， 就 把 独立 的 指令 放 和 人 读 取 延 时 槽 或 者 转移 延 时 模 。 

。 尽 量 利用 寄存 器 来 降低 从 存储 器 存 取 数 据 带 来 的 延迟 。 

。 将 LOAD 指 令 尽 可 能 地 放 到 指令 序列 的 前 面 以 降低 读 取 数据 延迟 的 影响 。 

。 把 计算 转移 地 址 的 指令 尽量 提前 以 降低 转移 延迟 的 影响 。 

。 尽 可 能 提前 执行 条 件 判 定 指令 ， 使 得 转移 指令 序列 能 够 得 到 优化 。 

。 修 改 转移 的 条 件 语句 使 得 在 大 多 数 情况 不 发 生 跳 转 。 

。 把 循环 语句 展开 (内 婴 循 环 代码 ) 以 避免 指令 乱 序 执行 带 来 的 影响 。 

。 尽 量 扩大 程序 中 的 一 个 基本 模块 (basic block， 一 个 基本 模块 只 有 一 个 入 口 和 一 个 出 口 ， 

且 没 有 内 部 循环 ) 的 大 小 。 


泪 
喜 


* 流水 线 技 术 是 通过 提高 指令 吞吐 量 而 不 是 通过 减少 指令 执行 时 间 来 提高 性 能 。 

“冒险 导致 了 复杂 化 。 

“为 了 使 外 理 吕 速度 更 快 ， 我 们 使 用 独立 的 多 条 指令 流水 线 来 实现 在 同一 时 刻 执 行 多 条 指 
， 我 们 称 之 为 超标 量 体 系 结构 。 

. 编 汪 革 能 够 它们 生成 的 吾 代 冯 重 新 排序 从 而 提高 流水 线 的 性 能 。 

"硬件 调度 技术 之 所 以 会 被 现代 RISC 微 处 理 器 所 采用 是 因为 处 理 器 在 内 部 要 通过 动态 调 

度 使 得 它 的 各 个 资源 尽量 处 于 忙碌 状态 。 


参考 文献 


1 David A. Patterson and David R. Ditzel, The Case for the Reduced Instruction Set Computer, ACM SIGARCH 
Computer Architecture News,8 (6), October 1980. pp. 25—33. 

” Manolis G. H. Kavantis, Reduced Instruction Set Computer Architectures for VLSI, The MIT Press, Cambridge, MA， 
1986. 

: David Resnick, Cray Corporation, Private Communication. 

“ J.E. Thornton, Design of a Computer: The Control Data 6600, Scott Foresman and Company, Glenview, ll, 1970. 

5 W.C. Alexander and D.B. Wortman, Static and Dynamic characteristics XPL Programs, pp. 41-46, November 1975, 
Vol. 8, No. 11. 

4 Jim Turley, Starting Down the Pipeline Part 1, Circuit Cellar, Issue 143, June, 2002, p. 44. 

7 See Sloss et al, Chapter 11. 

8 David A. Patterson and John L. Hennessy, Computer Organization and Design, Second Edition, ISBN 1-5586-0428-6, 
Morgan-Kaufmann Publishers, San Francisco, 1998, p. 437. 

? Jim Turley, op cit, p. 46. 

" Matthew Wilson, “Comparting C/C++ Compilers,” Dr. Dobbs Journal, October 2003, p. 16. 

1 Daniel Mann, Programming the 29K RISC Family, ISBN 0-1309-1893-8, Prentice-Hall, Englewood Cliffs, NJ, 1994, 
Pp. 10. 


?2 Mike Johnson, Superscalar Microprocessor Design, ISBN 0-1387-5634-1, Prentice-Hall, Englewood Cliffs, NJ, 1991. 369 


306 务 13 间 


习题 


CN 


iD 


LD 


un 


.看 如 下 两 个 汇编 语言 的 代码 片段 。 为 了 简单 起 见 ， 我 们 采用 的 是 68K 的 汇编 语言 指令 。 在 


流水 线 上 执行 时 其 中 的 一 个 代码 片段 比 另 一 个 效率 高 。 指 出 该 代码 片段 ， 并 说 明 原因 。 












. 简 述 一 下 增加 一 条 流水 线 的 级 数 会 带 来 什么 样 的 问题 。 现 代 的 微 处 理 器 ， 如 Intel 的 奔腾 和 


AMD 的 Athlon， 它 们 运行 测试 码 的 效率 大 致 相当 ， 但 是 AMD 的 处 理 器 时 钟 频率 只 有 奔腾 处 
理 器 频率 的 65% 左 右 。 简 要 说 明 为 什么 会 出 现 这 种 情况 。 


.对 于 下 面 每 条 汇编 语言 指令 ， 分 别 指出 它们 是 否 符合 RISC 指 令 的 典型 特征 。 为 了 简单 起 见 ， 
我 们 采用 68K 的 助 记 符 来 表示 指令 。 
a. MOVEL $0A0055E0, $C0000000 
b. ADDL D6, D7 
c. MOVEL D5, (A5) 
d. ANDILW #$AAAA, $10000000 
e. MOVEL #$55555555, D3 
. 指令 : 


MOVEM.L D0-D3/D5/A0-A2, -(SP) 


是 一 个 典型 的 CISC 指 令 (尽管 ARM 指 令 集 体系 结构 中 也 有 一 个 类 似 的 指令 )。 用 一 串 RISC 
指令 重 写 这 条 指令 。 假 设 有 效 的 寻 址 模式 只 有 : 
a. 立即 数 寻 址 
b. 数据 寄存 器 直接 寻 址 
c. 地 址 寄存 器 直接 寻 址 
d. 地 址 寄存 器 间接 寻 址 
记 住 : 你 所 用 的 指令 结构 必须 属于 典型 的 RISC 指 令 集 体系 结构 。 


.假设 LD (LOAD) 指令 用 于 把 存储 器 中 的 数据 读 入 到 寄存 器 ，ST (STORE) 指令 用 于 把 寄 


存 器 中 的 数据 写 和 存储器。 下 面 的 一 段 指令 序列 是 某 RISC 处 理 器 的 汇编 语言 程序 的 一 部 分 ， 
该 处 理 器 有 64 个 通用 寄存 器 〈(R0~R63) ， 每 个 寄存 器 都 可 以 作为 地 址 寄存 器 (存放 存储 指 
针 ) 或 者 数据 寄存 器 ， 存 放 算 术 运 算 的 操作 数 。 用 一 两 句 话 简 述 为 什么 该 指令 序列 属于 
RISC 类 型 的 处 理 器 指令 。 

假设 指令 格式 为 : 操作 代码 源 操作 数 ， 目 的 操作 数 


交火 克 丙 丙 琴 光 炎 克 灾 炎炎 炎炎 炎炎 类 灾 太 太太 广大 六 六 交 炊 次 炎炎 炎炎 炎炎 到 太太 大坪 六 炎炎 炎炎 穴 炎 灾 兴 太太 太太 南 太 次 炎 


* 该 代码 序列 将 存储 器 中 的 两 个 数 相 加 后 ， 将 结果 写 信 了 第 三 个 存储 地 址 。 


克 交 克 炎 炎炎 炎炎 炎炎 次 克 灾 二 灾 交 次 炎 六 炎炎 炎炎 炎炎 炎炎 克 闪 交火 炎炎 到 砍 炎 炎炎 炎炎 太 六 克 次 炎炎 炎炎 炎炎 炎炎 克 炎 雁 六 


addr1 EQU $00001000 * 第 1 个 操作 数 

addr2 EQU $00001004 * 第 2 个 操作 数 

result EQU $00001006 * 结果 

start LD #addr1,R0 * 建立 第 1 个 地 址 
LD #addr2,R1 * 建立 第 2 个 地 址 
LD #result,R3 * 指向 结果 的 指针 
DD (RO) ,R60 * 获得 第 1 个 操作 数 
LD (R1) ,R61 * 获得 第 2 个 操作 数 
ADD R60,R61 * 相 加 
ST R61, (R3) * 存储 结果 


* 代码 序列 结束 。 
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. 编译 器 优化 程序 的 一 个 方法 是 把 一 些 特 定 的 循环 结构 (例如 for 循 环 ) 转化 成 一 段 较 长 的 内 

联 代码 。 那 么 这 样 做 的 优势 在 哪里 呢 ? 

.假定 某 个 处 理 器 有 一 个 7 级 的 流水 线 ， 运 行 的 时 钟 频 率 为 100MHz。 流 水 线 被 设计 为 每 级 流 

水 需要 2 个 时 钟 周 期 。 假 定 有 一 个 包含 10 条 指令 的 基本 程序 块 进入 流水 线 。 

a. 假定 流水 线 上 没有 阻塞 发 生 ， 那 么 从 第 一 条 指令 进入 流水 线 到 所 有 指令 执行 完毕 需要 花 
费 多 长 时 间 ? 

b. 如 果 在 执行 时 ， 每 两 条 指令 中 有 一 条 指令 会 导致 流水 线 阻 塞 4 个 时 钟 周期 ， 那 么 10 条 指令 
全 部 执行 完毕 需要 多 少时 间 ? 

8. 下 面 是 一 段 68K 处 理 器 的 汇编 语言 指令 代码 。 把 指令 执行 顺序 重新 调整 一 下 ， 以 便 这 些 指 

令 在 流水 线 处 理 器 体系 结构 上 执行 的 效率 更 高 。 


ee | 


MOVE.W D1,DO 
ADD.W D0 ,D3 
MULU D3,D1 
LEA (A4) ,A6 
MOVE.W #$3400, D2 
ADDA.W D7,A2 
MOVE .W #$F6AA, DA 


ww 
一 





第 14 章 存储 器 、 高 速 缓存 和 虚拟 生 储 器 


学 习 目 标 

。 解释 使 用 cache 的 原因 以 及 如 何 组 织 cache; 

。 描 述 各 种 cache 是 如 何 组 织 的 ， 

。 设 计 一 个 典型 的 cache 组 织 ， 

。 讨论 cache 性 能 的 相关 问题 ， 

。 解 释 虚 拟 存储 器 是 如 何 组 织 的 ， 

。 描 述 计 算 机 体系 结构 是 如 何 支持 虚拟 存储 管理 的 。 


14.1 高 速 缓存 简介 


在 介绍 高 速 缓存 (cache) 以 及 基于 cache 系 统 的 相关 主题 之 前 ， 我 们 先 回顾 一 下 以 前 讨论 
过 的 存储 器 类 型 。 存 储 器 的 主要 类 型 有 静态 随机 存储 器 (SRAM) 、 动 态 随机 存储 器 (DRAM) 
和 非 易 失 性 只 读 存储 器 (ROM) 。SRAM 存 储 器 基于 交叉 耦合 连接 的 反 向 逻辑 门 原理 。 输 出 的 
值 被 反馈 到 输入 ， 使 得 逻辑 门 被 锁定 在 一 个 或 另 一 个 状态 。SRAM 存 储 器 的 速度 很 块 ， 但 每 
个 存储 单元 需要 5 或 6 个 晶体 管 才能 实现 ， 因 此 它 往往 比 DRAM 存 储 器 成 本 要 高 。 

DRAM 以 电荷 的 形式 在 一 个 微小 的 电容 上 存储 逻辑 值 。 如 果 不 定期 剧 新 电荷 ， 电 容 上 的 
电荷 就 会 发 生 泄漏 ， 因 此 这 种 类 型 的 存储 器 必须 定期 进行 读 取 操作 。 这 就 是 为 什么 它 被 称 为 
动态 RAM 而 不 是 静态 RAM 的 原因 。DRAM 的 访问 周期 也 比 静态 RAM 要 复杂 得 多 ， 因 为 刷新 
周期 也 必须 考虑 在 内 。 

然而 ，DRAM 存 储 器 的 最 大 优势 在 于 它 的 高 密度 和 低 成 本 。 现 在 ， 你 只 花 60 美 元 就 可 以 
为 你 的 PC 买 一 个 单列 直播 内 存 模块 (SIMM) ， 这 是 具有 512M 容 量 的 DRAM。 在 这 样 的 价格 
下 ,我们 就 能 付 得 起 将 DRAM 接 口 管理 放 到 一 个 专用 芯片 上 的 费用 ， 而 该 专用 芯片 位 于 CPU 
与 存储 器 之 间 。 如 果 你 是 一 个 电脑 爱好 者 ， 喜 欢 对 自己 的 PC 进行 升级 ， 那 么 你 肯定 会 去 买 一 
个 新 的 主板 ， 并 采用 芯片 组 AMD、nVidia 或 者 VIA。 在 决定 计算 机 的 性 能 方面 ， 芯 片 组 已 经 
变 得 和 CPU 同样 重要 。 

随 着 应 用 程序 和 操作 系统 的 日 益 复杂 ， 计 算 机 系统 也 相应 地 需要 越 来 越 大 的 存储 量 。 在 
写 这 一 章 时 所 用 电脑 就 有 1024MB (1GB) 的 存储 量 ， 现 在 看 来 这 个 容量 似乎 高 于 平均 水 平 ， 
但 是 不 出 三 年 ， 它 很 可 能 就 是 推荐 配置 的 最 低 容量 。 不 久 以 前 ，10MB 的 硬盘 容量 还 让 人 觉得 
很 大 ， 现 在 你 花 100 美 元 左右 就 能 买 到 一 个 200GB 的 硬盘 ， 存 储 容量 增长 了 10 000 倍 。 鉴 于 我 
们 对 存储 要 求 的 无 止境 增长 ,不 管 是 对 易 失 性 存储 器 (如 RAM) 还 是 对 档案 存储 器 (如 硬盘 )， 
我 们 都 宜 于 从 体系 结构 的 角度 来 寻找 对 这 种 复杂 性 的 管理 方式 。 


存储 器 的 层次 


存储 器 是 分 层次 的 。 这 里 的 层次 并 不 是 说 某 些 存储 器 比 其 他 存储 器 更 重要 ， 而 是 从 存储 
器 “靠近 ”CPU 的 程度 来 区 分 的 。 越 “靠近 ”CPU ， 等 级 就 越 高 ， 反 之 就 越 低 。 注 意 ， 我 们 
说 到 “靠近 ”时 是 指 一 般 意义 上 的 靠近 ， 而 不 仅仅 是 指 “ 物 理 位 置 上 的 靠近 ”( 尽 管 这 种 靠近 
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也 是 一 个 重要 的 因素 ) 。 为 了 尽量 提高 处 理 器 的 吞吐 量 ， 速 度 最 快 的 存储 器 往往 被 放 在 最 靠近 
处 理 器 的 位 置 。 这 个 速度 最 快 的 存储 器 同时 也 是 最 昂贵 的 。 图 14-1 是 对 存储 器 层次 的 一 个 定 
性 表示 。 从 这 个 金字 塔 的 顶端 开始 ， 越 往 下 的 等 级 ， 对 应 类 型 的 存储 器 访问 时 间 就 越 长 。 
我 们 来 看 一 些 实际 的 例子 。 现 在 ，SRAM Se 
的 访问 时 间 是 2~25ns， 费 用 大 概 是 每 兆 字 节 50 i 
美元 。DRAM 的 访问 时 间 是 30~120ns， 费 用 为 入 
每 兆 字 节 0.06 美 元 。 硬 盘 的 访问 时 间 是 1 千 万 ~1 人 NN | 
亿 ns， 费 用 约 为 每 净 字 节 0.001~0.01 美 元 。 可 以 
看 到 ， 随 着 等 级 的 降低 ， 容 量 按 指数 级 增长 ， 
相应 的 访问 时 间 也 是 按 指数 级 增长 。 
图 14-2 显 示 出 了 一 个 典型 计算 机 系统 中 
的 存储 器 层次 ， 你 家 里 用 的 个 人 电脑 可 能 就 
是 这 样 的 。 注 意 ， 这 个 系统 中 有 两 个 独立 的 a en eine 
cache, 一 个 在 芯片 内 , 通常 被 称 为 Ll cache， 延 ， 
呈正 外 - 革 罗 2 避 a 帮 区 天 扫 容量 越 大 ， 访 问 时 间 越 长 
别 越 低 ， 存 储 容量 越 大 ， 访 问 速度 越 慢 。 我 们 可 以 想像 出 来 ， 在 这 个 金字 塔 的 最 底层 就 是 ”[37 引 
Internet 了 。 在 这 一 级 ， 存 储 容量 几乎 是 无 限 大 的 ， 访 问 时 间 也 常常 是 无 限 长 的 。 















总 线 接口 单元 


二 级 cache, 256K~4MB(20ns) 
主 存 储 器 ，1MB~1.5GB(30ns) 


硬盘 ，1G~200GB(100 000ns) 


磁带 机 ，50G~10TB( 秒 ) 







图 14-2 典型 计算 机 系统 中 的 存储 器 层次 


局 部 性 


在 继续 讨论 cache 之 前 ， 我 们 得 先 弄 清楚 cache 到 底 是 什么 。cache 是 一 个 邻近 的 本 地 存储 
系统 。 我 们 可 以 把 CPU 中 的 寄存 器 称 为 0 级 cache。 此 外 ， 在 CPU 芯片 上 还 可 以 看 到 另外 一 些 
更 大 的 cache 存 储 系统 ， 这 个 存储 器 一 般 与 CPU 的 频率 同步 ， 有 时 候 偶尔 也 会 比 正常 的 访问 速 
度 慢 一 些 。 大 多 数 处 理 器 都 有 两 个 独立 的 初级 cache， 一 个 用 于 存放 指令 ， 一 个 用 于 存放 数据 。 
我 们 知道 ， 这 是 哈佛 体系 结构 的 内 部 实现 方式 。 

cache 的 用 处 源 于 程序 所 具有 的 一 般 特 性 一 一 局 部 性 (locality) 。 有 两 种 类 型 的 局 部 性 ， 它 
们 分 别 以 不 同 的 方式 表现 了 同样 的 规律 。 引 用 局 部 性 (Locality of Reference) 是 指 程序 常常 
会 访问 最 近 访 问 过 的 数据 和 指令 ， 或 者 与 它们 存储 的 位 置 邻近 的 指令 和 数据 。 程 序 往往 是 依 
次 读 取 存 储 器 中 的 指令 来 执行 ， 循 环 操 作 往 往 是 把 相近 的 几 条 指令 重复 执行 。 从 数据 结构 的 
角度 来 说 ， 编 译 器 把 数组 存放 在 内 存 中 相 邻 的 块 内 ， 而 程序 一 般 是 顺序 访问 数组 元 素 。 而 且 ， 
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编译 器 把 不 相关 的 变量 存放 在 一 起 ， 例 如 存放 在 栈 内 的 局 部 变量 。 时 间 局 部 性 〈temporal 
locality) 是 说 一 旦 一 个 元 素 被 访问 后 ， 它 很 可 能 在 不 和 久 的 将 来 再 次 被 访问 。 空 间 局 部 性 
(spatial locality) 是 说 邻近 的 元 素 还 将 很 快 被 访问 。 . 

我 们 来 研究 一 下 在 有 2 个 级 别 的 存储 器 等 级 结构 中 局 部 性 原则 是 如 何 被 利用 的 。 该 例子 有 
一 个 较 高 级 别 的 存储 器 (cache 存 储 器 ) 和 一 个 较 低 级 别 的 存储 器 ( 主 存储 器 ) 。 二 级 的 结构 
意味 着 当 需 要 的 数据 不 在 cache 中 时 ， 我 们 要 去 低 一 级 的 主 存储 器 中 检索 至 少 一 个 数据 块 。 我 
们 定义 cache 命 中 (cache hit) 为 CPU 需 要 的 数据 或 指令 正好 在 cache 中 ,相反 如 果 不 在 cache 中 ， 
则 称 为 cache 不 中 (cache miss ) 。 

我 们 还 需要 定义 块 (block) 作为 数据 传输 的 最 小 单元 。 一 个 块 可 以 只 有 一 个 字 节 大 小 ， 
也 可 以 有 几 百 字 节 大 小 。 在 实际 应 用 中 ， 一 个 块 的 大 小 一 般 是 16 到 64 个 字 节 。 说 到 这 里 ， 可 
能 有 人 要 问 :“ 为 什么 要 从 主 存储 器 里 读 取 整 个 块 ? 为 什么 不 只 取 我 们 需要 的 指令 或 者 数据 ?” 
这 是 因为 局 部 性 规律 告诉 我 们 ， 如 果 需 要 的 第 一 部 分 信息 不 在 cache 中 ， 那 么 很 可 能 接 下 来 需 
要 的 信息 也 不 在 cache 中 ， 所 以 我 们 就 把 整个 数据 块 都 读 人 cache。 

这 样 做 还 有 另 一 个 实际 的 原因 。DRAM 存 储 器 要 花 一 些 时间 来 建立 对 第 一 个 数据 的 访问 。 
但 是 只 要 访问 建立 起 来 ，CPU 就 可 以 只 再 花 很 小 的 额外 开销 就 能 从 存储 器 中 传输 更 多 的 连续 
字 节 ， 尤 其 是 在 一 次 有 大 量 的 数据 要 从 存储 器 读 取 到 CPU 的 时 候 。 这 种 情况 被 称 为 突 发 模式 
访问 (burst mode access)。 现 代 的 SDRAM 存 储 器 能 很 好 地 支持 突 发 模式 访问 ， 这 非常 适合 现 
代 的 处 理 器 要 求 。 突 发 模式 访问 需要 花费 一 些 时 钟 周期 来 建立 环境 ， 使 得 存储 器 的 支持 芯片 
集 能 确立 突 发 访问 的 初始 地 址 。 然 而 ， 在 地 址 被 确立 后 ，SDRAM 就 能 在 外 部 总 线 的 每 个 时 钟 
周期 内 完成 两 个 存储 器 读 取 周 期 。 目 前 ， 在 总 线 频率 200MHz， 存 储 器 宽 64 位 的 情况 下 ， 在 一 
次 实际 的 突 发 传输 中 从 存储 器 到 CPU 的 传输 速率 能 达到 每 秒 3.2GB 。 

再 打 一 个 比方 ， 用 你 日 常生 活 中 的 事情 来 类 比 存储 器 的 分 级 。 想 像 一 下 你 在 书桌 前 不 停 
地 工作 ， 处 理 教授 按时 分 配 下 来 的 无 穷 无 尽 的 任务 。 你 在 身边 放 了 一 些 你 最 经 常用 到 的 书籍 ， 
警 如 上 课 用 的 教材 ， 把 它们 放 在 书桌 上 或 者 书架 上 。 这 些 书 放 在 手边 ， 非 常 方便 查阅 ， 但 是 
你 只 能 放 有 限 的 一 些 书 。 

假设 现在 某 个 作业 需要 你 去 工程 图 书 锯 借 另外 的 一 本 书 来 参考 。 工 程 图 书馆 里 面 的 书 显 
然 比 你 放 在 身边 的 书 多 很 多 ， 但 是 找到 需要 的 书 花费 的 时 间 也 更 多 一 些 。 而 且 ， 如 果 在 工程 
图 书馆 里 找 不 到 需要 的 书 ， 那 么 接着 你 可 能 还 得 到 华盛顿 的 国会 图 书馆 去 找 。 显 然 ， 在 每 一 
级 图 书馆 ， 为 了 能 获得 更 多 的 馆藏 资料 ， 我 们 就 得 花 更 多 的 时 间 。 这 里 ， 我 们 传输 的 单元 是 
一 本 书 ， 所 以 在 这 个 类 比 中 ， 一 本 书 就 等 同 于 一 个 块 。 

现在 我 们 回顾 一 下 ， 并 按 这 个 例子 中 的 术语 重新 进行 定义 : 

。 块 (block); 数据 传输 的 单元 (一 本 书 ) 

。 命 中 率 (hit rate) : 访问 的 数据 在 cache 中 的 概率 (在 书桌 上 的 概率 ) 

。 不 中 (miss rate); 访问 数据 不 在 cache 中 的 概率 (1 一 命中 率 ) 

。 命 中 时 间 (hit time) ， 从 cache 中 读 取 数据 所 需要 的 时 间 (从 书桌 上 拿 一 本 书 ) 

。 不 中 惩 到 (miss penalty) : 把 cache 中 的 块 用 你 需要 的 块 替 换 所 需要 的 时 间 (去 图 书馆 

取 另 一 本 书 ) 

我 们 可 以 得 到 一 个 计算 有 效 执行 时 间 (effective execution time) 的 简单 公式 。 这 就 是 ， 
给 定 了 所 需 指 令 是 否 在 cache 中 的 概率 ， 一 条 指令 的 平均 执行 时 间 。 这 里 有 一 个 细微 的 地 方 需 
要 说 明 一 下 ， 不 中 惩罚 就 是 由 于 处 理 器 必须 执行 不 在 cache 中 的 指令 所 产生 的 时 间 延 迟 。 尽 管 
大 多 数 带 cache 的 处 理 器 容许 你 设置 是 否 使 用 cache， 但 我 们 假设 你 使 用 cache。 

有 效 执行 时 间 二 命中 率 x 命中 时 间 十 不 中 率 x 不 中 时 间 
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如 果 指 令 或 数据 不 在 cache 中 ， 那 么 处 理 器 在 读 下 一 条 指令 前 必须 重新 装载 cache， 而 不 只 
是 直接 到 存储 器 中 取 指 令 。 因 此 ， 还 需要 额外 的 时 间 来 等 待 块 从 存储 器 载 人 到 cache。 

让 我 们 做 一 个 实际 的 例子 。 假 设 我 们 有 一 个 带 cache 的 处 理 器 ， 时 钟 频 率 为 100MHz。 在 
cache 中 的 指令 要 执行 两 个 时 钟 周 期 。 不 在 cache 中 的 指令 必须 从 主 存储 器 中 按 块 读 入 ， 块 的 大 
小 为 64 个 字 节 。 从 主 存储 器 中 读 取 数据 需要 先 花 10 个 时 钟 周期 建立 数据 传输 ， 之 后 处 理 器 每 
个 时 钟 周 期 能 读 取 一 个 32 位 宽 的 字 。 假 设 cache 的 命中 率 为 90%6 。 

1. 这 个 练习 的 困难 部 分 是 计算 不 中 惩罚 ， 我 们 先 把 它 求 出 来 。 

a. 时 钟 频率 为 100MHz 一 > 时 钟 周 期 为 10ns 

b. 建立 突 发 访问 需要 10 个 周期 = 10 x 10ns = 100ns 

c. 32 位 宽 的 字 =4 字 节 一 > 64 字 节 的 块 需要 16 次 数据 传输 

d. 16x lO0ns= 160ns 

e. 不 中 时 间 = 100ns + 160ns = 260ns 

2. 每 条 指令 执行 需要 2 个 时 钟 周期 ， 或 者 说 20ns。 

3. 有 效 执 行 时 间 =0.9 x 20 二 0.1 x 260=18 二 26=44ns 

即使 从 这 个 简单 的 例子 也 可 以 看 出 ， 有 效 执行 时 间 与 cache 的 一 些 参数 是 息息相关 的 。 有 
效 执行 时 间 是 cache 内 指令 执行 时 间 的 2 倍 多 。 因 此 ， 理 论 上 效率 可 以 提高 一 信 上 下 ， 这 样 一 
来 设计 者 们 就 有 得 忙 了 。 

现在 有 几 个 基本 的 问题 ; 

1. 我 们 怎样 才能 提高 cache 命 中 率 呢 ? 

2. 我 们 怎样 才能 降低 cache 不 中 惩罚 呢 ? 

对 于 第 1 个 问题 ， 我 们 可 以 设置 更 大 的 cache。 一 个 较 大 的 cache 能 存放 更 多 的 主 存储 器 中 
的 数据 ， 这 样 就 能 提高 cache 命 中 的 可 能 性 。 我 们 还 可 以 改变 cache 的 设计 。 也 许 通过 一 些 方 法 
来 组 织 cache 可 以 让 我 们 更 好 地 利用 cache 中 已 经 存在 的 数据 。 记 住 ， 与 随机 逻辑 相 比 ， 存 储 器 
在 芯片 上 要 占用 很 大 的 空间 ， 如 果 用 几 千 个 逻辑 门 来 实现 一 个 好 的 调度 算法 ， 可 能 比 增加 
100K 的 cache 更 有 效 。 

我 们 还 可 以 从 编译 器 设计 者 那里 寻求 帮助 。 也 许 他 们 能 够 对 代码 结构 进行 改进 ， 从 而 使 
cache 命 中 率 有 更 好 的 贡献 。 当 然 ， 这 个 并 不 那么 容易 实现 ， 因 为 cache 的 行为 有 时 会 与 直觉 相 
反 。 算 法 中 一 个 小 的 改变 有 时 就 可 使 有 效 执行 时 间 产 生 大 的 波动 。 例 如 在 我 的 《嵌入 式 系 统 
实验 室 》 课 里 ， 学 生 们 做 实验 试图 微调 一 个 算法 ， 使 得 在 没有 cache 和 有 cache 情 况 下 的 运行 时 
间 差 别 最 大 化 。 我 们 将 这 变 成 了 一 个 小 竞赛 ， 最 好 的 学 生得 到 的 结果 是 15 : 1。 


cache 组 织 


我 们 将 要 涉及 的 第 一 个 问题 非常 简单 :“ 我 们 怎样 才能 知道 一 个 元 素 (指令 或 数据 ) 在 
cache 里 面 ? ”如 果 是 在 cache 里 , “我 们 怎么 找到 它 ? ”考虑 这 个 问题 非常 重要 。 要 记 住 ， 你 
的 程序 是 在 主 存储 器 中 而 不 是 在 cache 中 被 编写 、 编 译 并 连接 来 运行 的 。 一 般 来 说 ， 编 译 器 并 
不 了 解 cache， 尽 管 它 可 以 做 一 些 编译 优化 来 利用 带 cache 的 处 理 器 。 程 序 中 引用 的 地 址 都 是 指 
主 存储 器 地 址 ， 而 不 是 cache 地 址 。 因 此 ， 我 们 需要 设计 一 个 方法 ， 以 某 种 方式 把 主 存 储 器 中 
的 地 址 映射 到 cache 中 的 地 址 。 

我 们 还 有 另外 一 个 问题 。 如 果 我 们 改变 了 一 个 值 ， 而 这 个 新 值 必须 立刻 写 回 到 主 存储 器 


中 去 ， 那 会 怎样 呢 ? 从 效率 上 来 考虑 ， 我 们 只 把 它 写 和 cache 就 行 了 ， 但 是 这 会 导致 一 个 潜在 


的 灾难 性 问题 ，cache 中 的 数据 和 主 存储 器 中 的 数据 不 再 一 致 了 。 最 后 ， 我 们 如 何 设计 一 个 
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cache 使 命中 率 达到 最 大 呢 ? 下 面 我 们 将 尝试 回答 这 些 问 题 。 

在 第 一 个 例子 中 ， 块 的 大 小 正好 是 一 个 存储 器 的 字 ， 这 种 cache 设 计 我 们 称 为 直接 映像 
cache (direct-mapped cache) 。 在 这 种 方式 下 ， 低 一 级 存储 器 中 的 每 一 个 字 刚 好 在 cache 中 有 一 
个 可 找到 的 位 置 。 这 样 ， 对 于 cache 中 的 每 一 个 存储 位 置 ， 低 一 级 存储 器 中 就 有 大 量 的 位 置 与 
其 对 应 ， 如 图 14-3 所 示 。 


主 存储 器 
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14-3 将 IK 的 cache 直 接 映 像 到 1M 的 主 存储 器 。cache 中 的 每 个 位 置 映像 到 主 存储 器 中 的 1024 个 位 置 


由 图 14-3 可 以 看 出 ， 假 设 cache 大 小 是 1024 个 字 (1K)， 主 存储 器 大 小 为 1 048 576 个 字 
(1M)， 则 cache 中 的 一 个 位 置 要 映射 到 主 存储 器 中 的 1024 个 位 置 。 这 没有 什么 ， 但 是 我 们 需要 
知道 在 某 一 时 刻 ， 这 1024 个 单元 中 的 哪 一 个 位 置 在 cache 中 ， 因 此 ，cache 中 每 个 位 置 还 需要 包 
含 更 多 的 信息 ， 以 指出 在 主 存储 器 中 相应 的 位 置 。 

每 个 cache 存 储 位 置 包括 多 个 cache 入 口 ， 每 个 入 口 由 几 部 分 组 成 。 每 个 cache 位 置 包 含 与 
之 映像 的 1024 个 主 存储 器 位 置 之 一 中 的 指令 和 数据 。 每 个 cache 单 元 还 包含 一 个 地 址 标签 
(address tag) ， 这 个 标签 指出 1024 个 主 存储 器 位 置 中 的 哪 一 个 恰好 在 cache 中 的 相应 位 置 。 关 
于 这 个 问题 值得 我 们 进一步 讨论 。 


cache 存 储 器 
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地 址 标签 


几 节 课 前 我 们 开始 讨论 存储 器 组 织 时 ， 我 们 知道 了 分 页 的 概念 。 在 这 里 ， 你 可 以 把 主 存 
储 器 看 作 是 由 1024 个 页 组 成 的 ， 每 页 包含 1024 个 字 。 主 存储 器 中 的 一 页 映像 到 cache 中 的 一 页 。 
因此 ， 主 存储 器 中 第 一 个 字 的 二 进 制 地 址 是 0000 0000 0000 0000 0000， 最 后 一 个 字 的 地 址 是 
1111 1111 1111 1111 1111。 我 们 把 它 分 成 页 和 偏 移 。 第 一 字 的 页 地 址 就 是 00 0000 0000， 偏 
移 地 址 是 00 00000000。 最 后 一 个 页 地 址 为 11 1111 1111， 偏 移 地 址 是 11 1111 1111。 

用 十 六 进 制 地 址 来 表示 的 话 ， 我 们 可 以 称 最 后 一 个 存储 器 字 的 地 址 为 $3FF/$3FF (页 / 偏 
移 )。 这 样 做 并 没有 改变 什么 ， 只 是 通过 将 位 分 组 后 把 存储 地 址 表示 成 与 直接 映像 cache 的 地 
址 表示 相对 应 的 方式 。 这 样 ， 每 个 cache 中 的 页 也 要 存放 与 之 映像 的 主 存储 器 的 页 地 址 。 

现在 ，cache 中 的 数据 要 么 是 主 存储 器 中 数据 (指令 、 数 据 ) 的 副本 ， 要 么 是 新 存储 的 数 
据 ， 还 没有 放 入 到 主 存储 器 中 。 数 据 的 cache 入 口 称 为 标签 (tag)， 包 含 了 块 在 主 存储 器 中 的 
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位 置信 息 以 及 有 效 性 (一致 性 ) 信息 。 因 此 ， 每 个 cache 入 口 必须 包含 的 信息 有 : 主 存储 器 中 
的 指令 或 数据 ， 块 来 自主 存储 器 中 的 哪个 页 ， 以 及 cache 中 的 数据 是 否 与 主 存储 器 中 的 数据 一 
致 。 如 图 14-4 所 示 。 

我 们 可 以 十 分 简单 地 总 结 一 下 cache 的 操作 。 我 们 必须 使 这 种 情况 的 概率 最 大 : 即 每 当 
CPU 进 行 取 指 令 操作 或 者 读数 据 操作 时 ， 指 令 或 数据 可 在 cache 中 得 到 。 对 于 许多 CPU 设 计 来 
说 ， 用 于 cache 管 理 的 算法 状态 机 设计 都 是 公司 的 最 高 机 密 之 一 。 这 个 复杂 硬件 模块 的 设计 将 
极 大 地 影响 cache 命 中 率 ， 进 而 影响 处 理 器 的 总 体 性 能 。 





图 14-4 将 1K 的 cache 直 接 映 像 到 1M 的 主 存储 器 上 。cache 中 的 
每 个 位 置 映像 到 主 存储 器 的 1024 个 存储 位 置 


绝 大 部 分 cache 实 际 上 都 可 以 分 为 3 个 基本 部 分 。 我 们 实际 上 已 经 把 各 个 部 分 都 讨论 过 了 ， 
下 面 只 是 花 一 点 时 间 总 结 一 下 : 

。cache 存 储 器 : 保存 存储 器 中 的 映像 。 

。 标 签 存储 器 : 存放 地 址 信息 和 是 否 有 效 的 位 。 确 定数 据 是 否 在 cache 中 ， 以 及 在 cache 中 

的 数据 是 否 和 主 存储 器 中 的 数据 一 致 。 

。 算 法 状态 机 : cache 的 控制 机 制 。 其 主要 功能 是 保证 CPU 所 需 数据 在 cache 中 。 

说 到 这 ， 我 们 一 直 在 采用 这 样 一 个 模型 ， 就 是 cache 和 存储 器 间 按 块 传输 数据 ， 而 且 每 个 
块 的 大 小 为 1 个 字 。 事 实 上 ，cache 和 主 存储 器 都 被 划分 成 了 相同 大 小 的 量 ， 称 为 重 充 线 (refill 
line) 。 一 个 重 充 线 通常 为 4 到 64 个 字 节 (2 的 整数 次 方 )， 它 是 cache 与 主 存储 器 之 间 交 换 数据 的 
最 小 量 。 主 存储 器 丢失 一 个 字 节 就 会 导致 对 包含 这 个 字 节 的 重 充 线 的 全 填充 。 这 就 是 为 什么 大 
多 数 带 cache 的 处 理 器 都 采用 突 发 模式 来 访问 存储 器 ， 而 通常 不 会 只 读 取 一 个 字 节 。 重 充 线 就 
是 我 们 前 面 讨论 过 的 数据 块 的 另 一 种 叫 法 。 

目前 ， 常 用 的 cache 有 4 种 类 型 ; 

1. 直接 映像 

2. 相 联 

3. 组 相 联 

4. 区 映像 
其 中 最 常用 的 一 种 是 4 路 组 相 联 cache， 因 为 它 在 可 接受 的 代价 和 复杂 度 下 有 最 好 的 性 能 。 

下 面 我 们 将 考察 每 种 类 型 的 cache。 


直接 映像 cache 


我 们 在 介绍 cache 设 计时 讨论 过 直接 映像 cache, 现在 我 们 再 从 重 充 线 (而 不 是 单个 字数 据 ) 
的 角度 来 重新 考察 它 。 直 接 映像 cache 把 主 存储 器 划分 为 一 个 二 维 矩 阵 ， 包 含 K 列 ， 每 列 N 个 
重 充 线 。cache 的 宽度 为 一 列 ， 长 度 为 N 个 重 充 线 。 第 N 行 cache 可 以 存放 主 存储 器 K 列 中 任何 
一 列 的 第 N 个 重 充 线 。 标 签 地 址 保存 了 存储 器 列 的 地 址 。 例 如 ， 假 设 有 一 个 处 理 器 ， 有 32 位 的 
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可 按 字 节 寻 址 的 空间 ， 有 一 个 256K 的 直接 映像 cache，cache 用 64 字 节 长 的 重 充 线 来 重新 载 入 。 
这 样 一 个 系统 会 是 什么 样子 呢 : 
1. 根据 重 充 线 对 cache 和 主 存储 器 重新 进行 划分 。 
a. 主 存储 器 包含 22 字 节 /25 字 节 每 重 充 线 =2” 个 重 充 线 
b. cache 存 储 器 包含 24 字 节 /25 字 节 每 重 充 线 =22 个 重 充 线 
2. 将 cache 存 储 器 表示 成 包含 22 行 的 单个 列 ， 主 存储 器 表示 成 22 行 、22/2 = 2 列 的 XY 和 矩 
阵 。 如 图 14-5 所 示 。 


cache 存 储 器 


器 
地 址 标签 ” 列 0x0000 列 0x0001 列 0x3FFE 列 0x3FFF 


行 0x000 








行 O0xFFF 


上 一 一 一 一 
重 充 线 i 


一 一 一 人 人、 
loojorjoalos| 。。。 [sclsplsslsr| 。 偏 移 地 址 
字 节 地 址 = 列 地 址 ， 行 地 址 ， 偏 移 地 址 


图 14-5 一 个 256KB 的 直接 映像 cache 示 例 。 其 中 主 存储 器 大 小 4G， 重 充 线 宽度 64B 


在 图 14-5 中 ， 我 们 把 主 存储 器 分 为 3 个 不 同 的 区 域 : 

。 在 重 充 线 中 的 偏 移 地 址 ; 

。 在 一 列 中 的 行 地 址 ， 

。 列 地 址 。 

我 们 把 主 存储 器 中 一 个 重 充 线 的 字 节 位 置 映像 到 了 cache 中 对 应 重 充 线 的 对 应 字 节 位 置 。 
换 句 话说 ， 一 个 字 节 在 主 存储 器 中 的 偏 移 地 址 和 在 cache 中 的 是 相同 的 。 而 且 ，cache 的 每 一 行 
也 对 应 于 主 存储 器 中 的 每 一 行 。 主 存储 器 中 每 列 的 一 行 ( 重 充 线 ) 都 映像 到 了 cache 中 同样 行 
号 的 行 ， 也 就 是 重 充 线 ， 而 列 地 址 则 存放 在 cache 中 的 标签 RAM 中 。 

地 址 标签 域 必须 能 够 存放 14 位 宽 的 列 地 址 ， 对 应 于 从 0x0000 到 0x3FFF 的 列 地 址 。 主 存储 
器 和 cache 都 有 4096 行 ， 对 应 于 从 0x000 到 0xFFF 的 行 地 址 。 

下 面 这 个 例子 中 ， 我 们 把 任意 一 个 字 节 地 址 映像 为 列 号 / 行 号 / 偏 移 地 址 的 模式 。 

字 节 地 址 =0xA7D304BE 


由 于 列 号 、 行 号 和 偏 移 地 址 不 一 定 都 在 十 六 进 制 数字 边界 上 (可 被 4 除 )， 所 以 使 用 二 进 
制 表示 比 用 十 六 进 制 更 方便 。 我 们 先 把 字 节 地 址 0xA7D304BE 表 示 成 一 个 32 位 的 二 进 制 数 ， 
然后 再 按 直 接 映 像 cache 的 列 号 、 行 号 和 偏 移 的 组 织 方式 进行 分 组 。 


1010 0111 1101 0011 0000 0100 1011 1110 * 8 个 十 六 进 制 数字 
偏 移 : 11 1110 = 0x3E 

行 号 : 1100 0001 0010 = 0xC12 

列 号 : 10 1001 1111 0100 = 0x29F4 
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这 样 ， 当 我 们 将 存储 器 重 映像 为 具有 64 字 节 宽 重 充 线 的 XY 矩 阵 时 ， 主 存储 器 中 
0xA7D304BE 的 字 节 地 址 将 被 重新 表示 为 0x29F4、0xC12、0x3E。 如 果 这 个 字 节 被 映像 到 
cache 中 ， 那 么 cache 中 包含 这 个 字 节 的 重 充 线 行 号 为 0xC12， 标 签 地 址 的 值 为 0x29F4， 字 节 所 
在 的 位 置 为 距离 重 充 线 第 一 个 字 节 0x3E 处 。 

直接 映像 cache 设 计时 相对 容易 实现 ， 但 是 性 能 却 相 当 受 限制 ， 因 为 在 任意 时 刻 ， 主 存储 
器 中 每 一 行 的 所 有 重 充 线 中 最 多 只 能 有 一 个 在 cache 中 。 下 面 这 个 例子 显示 了 这 个 限制 是 如 何 
影响 到 处 理 器 性 能 的 。 


10854BCA loop: 10894BC0 subroutine: 


JSR subroutine 一 一“ {some code} 
RTS 


{some code} 
BNE ioop 


有 两 个 比较 类 似 的 地 址 ， 一 个 是 循环 的 入 口 ， 另 一 个 是 循环 中 调用 的 子 程序 和 人口 。 如 果 
把 它们 按照 上 面 的 方法 分 解 ， 可 以 得 到 循环 的 地 址 是 : 

。 偏 移 = 0x0A 

。 行 号 = 0x52F 

。 列 号 = 0x0421 
子 程序 的 地 址 是 : 

。 偏 移 = 0x00 

。 行 号 = 0x52F 

。 列 号 = 0x0422 
因此 ， 这 种 比较 特殊 的 情况 是 可 能 发 生 的 ， 或 者 是 由 于 汇编 语言 算法 造成 的 ， 或 者 是 编译 器 
和 连接 器 共同 组 织 目标 代 码 映像 的 结果 。 总 之 ， 循 环 的 入 口 及 其 调用 的 子 程序 人 口 刚好 分 别 
处 于 相 邻 两 列 的 同一 行 。 

每 次 子 程序 被 调用 时 ，cache 控 制 器 必须 在 执行 子 程序 之 前 重新 载 人 第 0x422 列 的 第 0x52F 
行 。 同 样 ， 在 遇 到 RTS 指 令 时 ，cache 中 的 那 一 行 从 相 邻 的 那 一 列 重新 载 入 。 我 们 在 前 面 讨论 
过 如 何 计算 有 效 执行 时 间 ， 可 以 看 出 这 种 情况 下 代码 的 执行 速度 很 可 能 会 比 两 个 代码 片段 不 
在 同一 行 的 情况 下 慢 上 10 倍 。 

出 现 这 个 问题 主要 就 是 因为 直接 映像 cache 的 限制 。 由 于 对 任意 一 个 给 定 行 的 重 充 线 只 能 
映像 到 cache 中 的 一 个 位 置 ， 所 以 当 我 们 需要 访问 另 一 列 中 同一 行 的 重 充 线 时 ， 我 们 没有 选择 
只 能 替换 了 。 

在 灵活 性 方面 与 这 种 方法 相对 照 的 是 相 联 cache (associative cache) 。 接 下 来 我 们 来 讨论 
这 个 方式 。 


相 联 cache 


正如 我 们 前 面 已 经 讨论 过 的 ， 直 接 映像 cache 是 相当 受 限 的 ， 因 为 来 自主 存储 器 的 重 充 线 
映像 到 cache 的 位 置 受到 严格 限制 。 如 果 主 存储 器 中 映像 到 cache 中 某 个 地 址 的 两 条 重 充 线 都 经 
常 被 访问 ， 那 么 计算 机 将 要 花费 大 量 的 时 间 将 两 条 重 充 线 换 入 换 出 cache。 试 想 如 果 能 把 主 存 
储 器 中 的 某 个 重 充 线 映像 到 cache 中 任意 一 个 可 用 的 重 充 线 位 置 ， 那 将 会 极 大 地 提高 性 能 。 我 
们 把 这 种 组 织 方 式 称 为 相 联 cache。 图 14-6 是 相 联 cache 的 一 个 示意 图 。 

在 这 个 例子 中 ， 存 储 空间 大 小 为 1IMB ， 相 关 的 cache 为 4KB ， 重 充 线 大 小 为 64B 。cache 包 
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含 64 个 重 充 线 ， 主 存储 器 被 组 织 成 单列 的 2“ 个 重 充 线 (16KB)。 





主 存储 器 
行 0x0000 
行 0x0002 
a 行 0x0007 
行 0x0009 
行 0x3F Wm 行 0x3FF7 
行 Ox3FF9 
行 0x3FFF 
| 重 充 线 | 


图 14-6 一 个 4KB 的 相 联 cache 示 例 ， 其 中 主 存储 器 大 小 为 1M， 
重 充 线 大 小 为 64 字 节 [ 注 : DVD-ROM 光 盘 中 有 彩色 图 ] 


这 个 例子 代表 的 是 全 相 联 cache (fully associative cache)。 主 存储 器 中 的 重 充 线 可 以 映像 
到 cache 中 任意 一 个 可 用 的 重 充 线 位 置 ， 这 样 做 非常 好 ， 不 再 存在 直接 映像 cache 的 限制 了 。 图 
14-6 试 图 用 多 种 颜色 来 显示 cache 中 的 行 到 主 存储 器 的 行 的 近乎 随机 的 映像 。 然而 ， 相 联 cache 
的 复杂 性 随 着 cache 大 小 和 主 存储 器 大 小 的 增长 成 指数 级 增长 。 考虑 两 个 问题 : 

1 当 cache 中 所 有 可 用 的 行 中 都 存放 了 主 存储 器 中 的 有 效 行 时 ， cache 控 制 硬件 如 何 决 定 从 
主 存储 器 中 读 入 的 下 一 个 重 充 线 存放 在 cache 的 什么 位 置 呢 ? 

2. 由 于 主 存储 器 中 的 任何 重 充 线 可 以 映像 到 cache 的 任意 重 充 线 位 置 ， cache 的 控制 硬件 如 
何 确 定 主 存储 器 中 的 某 个 重 充 线 目 前 是 否 在 cache 中 呢 ? 

对 于 第 1 个 问题 ， 我 们 可 以 在 cache 每 一 行 的 后 面 设置 一 人 二 进 制 计数 器 。 每 经 过 一 个 时 
钟 周期 ， 所 有 的 计数 器 都 加 一 次 。 每 当 我 们 访问 cache 中 某 行 的 数据 时 ， 都 将 该 行 的 计数 器 复 
位 为 0。 当 计数 器 达到 最 大 值 时 ， 就 不 再 累加 ， 值 保 持 不 变 ， 并 不 返回 到 0。 

所 有 的 计数 器 值 将 被 输入 到 一 个 优先 级 电路 ， 该 电路 的 输出 是 计数 最 高 的 计数 器 所 在 行 
的 地 址 ， 这 个 行 地 址 就 是 下 一 个 读 入 cache 的 数据 存放 的 位 置 。 换 名 话说， 我 们 用 硬件 实现 了 
最 近 最 少 使 用 (least recently used, LRU) 算法 。 

至 于 第 2 个 问题 ， 这 里 引入 一 种 新 的 存储 器 设计 ， 称 为 可 按 内 容 寻 址 存储 器 (content 
addressable memory，CAM ) 。 CAM 可 被 看 作 是 反 向 意义 的 标准 存储 器 。 在 CAM 中 ， 输 入 的 
是 数据 ， 输出 的 是 CAM 中 存放 该 数据 的 地 址 。 CAM 的 每 一 个 存储 单元 还 包含 一 个 数据 比较 电 
路 。 当 cache 的 控制 单元 把 一 个 标签 地 址 送 入 CAM 时 ， 所 有 的 比较 器 都 并 行 地 进行 内 容 搜索 。 
如 果 输 入 的 标签 地 址 与 某 个 cache 标 签 地 址 位 置 所 存储 的 地 址 相符 ， 那么 电路 将 给 出 地 址 匹配 
(命中 ) 的 信息 ， 并 输出 该 主 存储 器 标签 地 址 的 cache 行 地 址 。 

随 着 cache 和 主 存储 器 空间 的 增长 ， cache 控 制 硬件 要 处 理 的 信息 规模 和 复杂 性 也 相应 迅速 
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增加 。 因 此 ， 在 实际 运用 的 cache 体 系 中 ， 全 相 联 cache 并 不 是 一 个 在 经 济 上 可 行 的 解决 方案 。 


组 相 联 cache 


实际 地 讲 ， 在 灵活 性 和 性 能 之 间 最 好 的 折 中 是 组 相 联 cache (set-associative cache) 设计 。 
组 相 联 cache 综 合 了 直接 映像 和 相 联 cache 的 特点 。 事 实 上 ， 在 现代 处 理 器 中 ， 四 路 组 相 联 
cache 是 最 常用 的 设计 。 它 等 于 是 在 多 列 上 的 直接 映像 。 例 如 ， 两 路 组 相 联 cache 有 两 个 直接 映 
像 的 列 ， 每 列 能 够 存放 主 存储 器 中 相应 行 的 任何 重 充 线 。 
图 14-7 显 示 了 一 个 两 路 组 相 联 cache 的 设计 。 
存储 器 


cache RAM 标签 RAM 





图 14-7 两 路 组 相 联 cache 设 计 。 由 Baron 和 Higbie' 提 供 [ 注 : 彩色 图 在 DVD 光盘 中 ] 


在 一 行内 ， 主 存储 器 中 的 任意 两 个 重 充 线 可 根据 标签 RAM 了 映像 到 cache 中 的 两 个 重 充 线 位 
置 之 一 。 一 个 一 路 的 组 相 联 cache 就 退化 成 了 一 个 直接 映像 cache。 

四 路 的 组 相 联 cache 已 经 成 为 现代 微 处 理 器 事实 上 的 标准 cache 设 计 。 大 多 数 微 处 理 器 都 采 
用 了 这 个 设计 (或 者 这 个 设计 的 变型 ) 作 为 片上 的 指令 cache 和 数据 cache、。 

图 14-8 描 述 了 一 个 4 路 的 组 相 联 cache 设 计 ， 下 面 是 一 些 参数 . 

。 主 存储 器 大 小 为 4G 字 节 

。cache 存 储 器 大 小 为 1M 字 节 

。 重 充 线 大 小 为 64 字 节 


cache RAM 地 址 标签 RAM 
0 1 2 3 0 1 2 列 O0x0000 列 Ox3FFF 
一 一 全 









行 O0x000 
" 
行 0xFFF 
| 一 -| jl 
重 充 线 重 充 线 


图 14-8 具有 32 位 存储 空间 和 1MBcache 的 4 路 组 相 联 cache。 重 充 线 大 小 为 64B 
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行 地 址 为 0x000 到 0xFFF (4096 个 行 地 址 )， 列 地 址 为 0x0000 到 0x3FFF (16 384 个 列 地 址 )。 如 
果 把 直接 映像 cache 与 一 个 同样 大 小 的 4 路 组 相 联 cache 做 比较 ， 我 们 会 看 到 前 者 的 列 数 只 有 后 者 的 
1/4， 前 者 行 数 为 后 者 的 4 倍 。 这 就 是 把 相同 数量 的 重 充 线 从 单列 重新 分 配 成 为 4 x N 和 矩阵 的 结果 。 

这 意味 着 在 这 个 4 路 组 相 联 cache 设 计 中 ，cache 每 一 行 能 映像 的 主 存储 器 重 充 线 的 数量 是 
直接 映像 cache 的 4 倍 。 乍 一 看 ， 这 似乎 对 性 能 设 有 太 大 的 提高 。 然 而 ， 关 键 还 在 于 4 路 设计 关 
联 性 。 即 使 有 4 倍 的 列 数 ， 而 且 行 在 cache 中 可 映像 到 4 个 可 能 位 置 ， 但 在 新 的 重 充 线 可 以 放 到 
这 4 个 位 置 中 的 哪 一 个 方面 ， 我 们 还 有 很 多 灵活 的 策略 。 辟 如， 我 们 可 以 在 这 4 个 可 能 cache 位 
置 处 应 用 一 个 简单 的 LRU 算 法 ， 这 就 避免 了 直接 映像 cache 中 产生 的 抖动 现象 。 

你 可 以 容易 地 看 出 ，4 路 组 相 联 cache 比 直接 映像 cache 具 有 额外 的 复杂 性 。 我 们 需要 与 全 
相 联 cache 相 类 似 的 附加 电路 ， 用 来 决定 cache 赫 换 策略 和 检 筒 地 址 标签 命中 情况 。 但 是 ， 与 全 
相 联 相 比 4 路 组 相 联 的 设计 实现 起 来 简单 很 多 。 记 住 直 接 映像 cache 就 是 一 个 1 路 组 相 联 cache。 

最 后 我 们 要 讨论 的 cache 设 计 叫 作 区 映像 cache (sector-mapped cache) ， 这 种 方式 是 对 相 
联 映像 的 一 种 改进 。 主 存储 器 和 重 充 线 被 分 组 成 多 个 区 〈 行 )。 主 存储 器 中 的 一 个 区 能 够 映像 
到 cache 中 的 一 个 区 ， 而 cache 采 用 一 个 相 联 存储 器 来 进行 映像 。 标 签 RAM 中 的 地 址 是 区 地 址 。 
区 映像 引入 的 一 个 额外 的 复杂 性 是 标签 RAM 需 要 有 效 位 (validity bit) ， 该 有 效 位 跟踪 主 存储 
器 中 目前 在 cache 中 的 重 充 线 。 图 14-9a 图 示 了 区 映像 cache 设 计 。 


~、 


cache 存 储 器 入 口 













FFFFFF 
重 充 线 一 | 一 
区 (4 个 重 充 线 ) 一 一 ~ | 
图 14-9a 一 个 32 位 地 址 存储 系统 的 区 映像 cache 的 示意 图 。 其 中 ， 每 个 区 有 4 个 重 充 线 ， 每 个 重 充 线 大 小 
为 64 字 节 。 当 前 只 有 区 地 址 为 0x35D78E 的 10 位 置 处 的 重 充 线 是 有 效 的 


在 这 个 例子 中 ， 我 们 将 一 个 有 32 位 地 址 范围 的 存储 系统 映像 到 了 一 个 任意 大 小 的 cache 中 ， 
每 个 区 包含 4 个 重 充 线 ， 每 个 重 充 线 包 含 64 个 字 节 。 在 这 个 特殊 的 例子 中 ， 第 0x35D78E 区 中 的 
第 10 号 重 充 线 是 有 效 的 ， 所 以 相应 的 有 效 位 设置 如 图 。 

为 什么 需要 有 效 位 可 能 还 不 明确 ， 这 个 简单 的 例子 应 该 有 助 于 说 明 这 一 点 。 记 住 ， 我 们 是 通过 
区 地 址 来 将 主 存储 器 映射 到 cache 的 ， 一 个 区 中 的 重 充 线 在 主 存储 器 和 cache 中 保持 相同 的 相对 区 地 
址 ， 而 我 们 每 次 只 是 访问 一 个 区 中 的 一 条 重 充 线 。 

由 于 相对 于 主 存储 器 的 区 ，cache 是 全 相 联 的 ， 所 以 我 们 可 采用 某 种 LRU 算 法 来 决定 cache 
中 的 哪 一 条 重 充 线 可 以 被 替换 。 一 个 新 区 中 的 重 充 线 第 一 次 映像 到 cache 中 时 ， 区 地 址 会 被 更 
新 ， 只 有 导 臻 cache 入口 被 更 新 的 重 充 线 是 有 效 的 ， 剩 下 的 3 个 重 充 线 00、01 和 11 对 应 于 以 前 
的 区 ， 不 对 应 于 主 存储 器 在 这 个 新 区 地 址 的 重 充 线 。 所 以 ， 我 们 需要 有 效 位 。 

通过 把 重 充 线 按 行 分 组 ， 我 们 降低 了 纯粹 的 相 联 cache 设 计 的 复杂 性 。 在 这 个 例子 中 ， 我 们 
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将 问题 简化 了 4 倍 。 在 一 个 区 内 ， 每 个 主 存储 器 中 的 重 充 线 都 必须 映像 到 cache 中 的 对 应 位 置 。 然 
而 ，cache 的 相 联 特性 还 引入 了 另 一 层 的 复杂 性 。 当 我 们 从 区 中 装载 一 个 重 充 线 到 cache 中 时 ， 标 
签 RAM 的 地 址 必须 对 应 于 刚 加 入 重 充 线 的 区 地 址 。 其 他 重 充 线 可 能 还 存放 有 别 的 区 的 数据 。 因 
此 ， 我 们 需要 一 个 有 效 位 来 指明 在 一 个 cache 区 内 哪些 重 充 线 对 应 于 主 存储 器 中 的 正确 的 重 充 线 。 

图 14-10 显 示 了 不 中 率 (miss rate) 在 不 同 cache 大 小 时 随 cache 相 联 性 的 变化 情况 。 

显然 相 联 cache 的 加 入 极 大 地 提高 了 cache 的 命中 率 。 而 且 ， 随 着 cache 容 量 增加 ， 命 中 率 
受 相 联 度 的 影响 降低 ， 因 此 当 cache 从 4 路 改 到 8 路 时 不 中 率 并 没有 明显 的 改善 。 

图 14-11 显 示 了 当 cache 和 重 充 线 的 大 小 增加 时 ， 不 中 率 降低 的 情况 。 注 意 ， 这 些 曲 线 是 浙 
近 线 ， 而 且 当 重 充 线 大 小 超过 64 字 节 时 ， 不 中 率 几 乎 就 没什么 改善 了 。 而 且 ， 当 cache 大 小 达 
到 64KB 时 ， 系 统 的 性 能 也 开始 急剧 下 降 。 当 然 ， 我 们 现在 知道 这 是 局 部 性 的 一 种 表现 ， 只 要 
给 我 们 一 些 好 的 数据 ， 我 们 就 能 知道 什么 样 的 cache 最 适合 我 们 的 需求 。 
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图 14-10 cache 相 联 度 随 不 中 率 的 变化 情况 ， 由 Patterson 和 Hennessys 提 供 


下 面 我 们 更 定量 地 考察 一 下 性 能 。 下 面 两 个 公式 给 出 了 一 个 简化 的 性 能 模型 ， 

1. 执行 时 间 = (执行 周期 二 延迟 周期 ) x (周期 时 间 ) 

2. 延迟 周期 = (指令 数 ) x (不 中 率 ) x (不 中 德 罚 ) 

执行 时 间 ， 或 者 说 运行 一 个 算法 所 需要 的 时 间 取 决 于 两 个 因素 。 首 先 ， 算 法 中 实际 有 多 
少 条 指令 (执行 周期 )， 以 及 有 多 少 个 周期 花费 到 了 填充 cache 上 (延迟 周期 )。 要 记得 处 理 器 
总 是 从 cache 中 得 到 数据 执行 ， 所 以 如 果 数 据 没 有 在 cache 中 ， 处 理 器 就 必须 等 到 cache 被 重新 
填充 后 才能 继续 执行 。 


不 中 率 随 块 大 小 的 变化 情况 








16 字 节 64 字 入 256 字 池 
块 大 小 
图 14-11 不 中 率 随 块 大 小 的 变化 情况 ， 由 Agarwal2 提 供 


延迟 周期 是 cache 命 中 率 的 函数 ， 所 以 它 取 决 于 要 执行 的 指令 总 数 。 有 些 指令 没有 被 cache 
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命中 ， 所 以 对 于 每 次 未 命中 ， 都 会 招致 一 个 不 中 惩罚 。 惩 罚 就 是 在 程序 能 继续 执行 前 ， 重 填 


充 cache 所 需 的 时 间 。 
由 此 我 们 可 以 看 到 两 种 改善 性 能 的 策略 : 
1. 降低 不 中 率 


2. 降低 不 中 惩罚 

如 果 我 们 增加 块 的 大 小 会 怎样 呢 ? 如 图 14-11 所 示 ， 随 着 趋 进 64 字 节 ， 性 能 会 有 些 改善 ， 
但 是 重 充 线 越 大 ， 不 中 惩罚 就 越 大 ， 因 为 每 次 不 中 时 就 要 重 填充 更 多 的 数据 ， 所 以 性 能 就 可 
能 变 坏 而 不 是 更 好 。 

从 图 14-10 中 我 们 也 可 以 看 出 为 什么 四 路 组 相 联 cache 会 如 此 流行 。 要 注意 的 是 ， 只 要 
cache 本 身 变 得 足够 大 ， 对 于 不 同类 型 的 组 相 联 cache， 不 中 率 就 没有 显著 变化 。 

下 面 继续 我 们 关于 如 何 提高 整个 cache 性 能 的 讨论 ， 我 们 将 考虑 一 些 目前 还 设 有 考虑 到 的 
因素 。 在 给 定 不 中 率 的 情况 下 ， 我 们 可 以 通过 降低 不 中 惩罚 来 提高 总 体 性 能 。 因 此 ， 如 果 不 
中 发 生 在 主 cache， 我 们 可 以 加 入 一 个 2 级 cache 来 降低 不 中 惩罚 。 

通常 ， 主 cache (L1) 与 处 理 器 在 同一 个 芯片 上 。 我 们 可 以 在 主 存储 器 (DRAM) 以 上 用 
速度 非常 快 的 SRAM 加 入 另 一 级 cache (L2)。 采 用 这 种 方式 ， 当 数据 在 二 级 cache 中 时 ， 不 中 
惩罚 就 会 降低 。 例如, 假设 有 一 个 处 理 器 , 每 个 时 钟 周 期 执行 1 条 指令 (周期 每 指令 CPI= 1.0)， 
时 钟 频率 为 500MHz， 不 中 率 为 5%，DRAM 的 访问 时 间 为 200ns。 

通过 加 入 一 个 访问 时 间 为 20ns 的 L2 cache， 我 们 能 将 总 的 不 中 率 降低 到 2%。 因 此 ， 通 过 
采用 多 级 cache 策 略 ， 我 们 可 以 尽量 提高 1 级 cache 的 命中 率 ， 降 低 2 级 cache 的 不 中 率 。 


cache 写 策略 


只 要 你 把 指令 和 数据 从 存储 器 中 读 出 并 将 它们 映像 到 cache 以 获得 更 好 的 性 能 ， 这 个 cache 
操作 就 会 相对 简单 。 但 新 产生 的 数据 必须 要 写 入 存储 器 时 ， 复 杂 度 就 会 急剧 增加 。 如 果 数 据 
存 回 cache， 那 么 cache 中 的 数据 和 存储 器 中 的 对 应 数据 就 不 相同 (一致) 了 。 这 是 一 个 严重 的 
问题 ， 可 能 会 在 某 些 情况 下 导致 系统 崩溃 ， 因 此 值得 关注 。 一 般 而 言 ， 从 数据 写 入 的 角度 来 
看 ，cache 的 活动 可 以 分 为 两 类 : 

通 写 cache (write-through cache) ， 数据 写 和 人 cache 后 立刻 写 和 人 到 主 存 储 器 。 通 写 cache 在 
向 外 存储 器 写 数据 时 的 性 能 不 错 ， 但 该 策略 要 求 cache 与 主 存储 器 中 的 数据 必须 始终 一 致 。 

回 写 cache (write-back cache) : 数据 被 暂时 保存 ， 直 到 总 线 空闲 不 会 影响 其 他 的 操作 时 ， 
才 人 允许 写 数据 。 实 际 上 回 写 过 程 也 可 以 等 到 整个 块 的 数据 都 要 写 时 才 开 始 进行 。 我 们 把 数据 
的 回 写 也 叫做 后 写 (post-write)。 此 外 ， 我 们 需要 记录 哪些 cache 单 元 包含 不 一 致 的 数据 。 如 
果 某 个 存储 单元 还 其 更 新 的 数据 还 在 cache 中 ， 就 称 之 为 脏 单元 (dirty cell)。 对 于 采用 回 写 策 
略 的 cache ， 其 标签 KAM 必须 包含 有 效 位 来 跟踪 脏 单元 。 

如 果 数 据 的 映像 不 在 cache 中 ， 就 不 会 有 什么 问题 ， 因 为 数据 可 以 直接 写 入 到 外 存储 器 ， 
就 好 像 没 有 cache 一 样 。 这 称 为 绕 写 cache (write-around cache)， 因 为 不 在 cache 中 的 数据 被 直 
接 写 到 了 存储 器 。 另 外 一 种 方式 是 ， 如 果 有 可 用 的 cache 块 ， 而 且 没 有 对 应 的 脏 存 储 单 元 ， 则 
cache 可 先 把 数据 存 人 cache， 然 后 再 根据 cache 的 设计 策略 进行 通 写 或 者 后 写 。 

我 们 来 总 结 一 下 对 cache 的 讨论 : 

*。 有 两 种 类 型 的 两 种 局 部 性 : 空间 和 时 间 。 

“cache 中 的 内 容 包 括 数据 、 标 签 和 有 效 位 。 

。 空 间 局 部 性 要 求 更 大 的 块 容 量 。 

。 因 为 处 理 器 速度 变 得 比 存储 器 越 来 越 快 ， 不 中 惩罚 也 不 断 增加 ， 所 以 现代 处 理 器 都 采用 
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组 相 联 cache。 
。 我 们 采用 了 指令 与 数据 分 开 存储 的 cache。 
为 了 避免 出 现 冯 : 诺 依 曼 瓶 颈 ， 
。 多 级 cache 被 用 于 降低 不 中 惩罚 (假设 L1 cache 在 片上 )， 
“存储 系统 设计 成 支持 突 发 模式 访问 的 cache。 


14.2 虚拟 存储 器 


还 记得 存储 器 的 层次 吗 ? 在 存储 器 层次 中 ,一旦 到 了 主 存储 器 以 下 ， 就 需要 用 虚拟 存储 
器 提供 的 方法 来 将 较 低 层次 存储 器 映像 到 较 高 层次 存储 器 。 我 们 使 用 大 量 的 慢 速 存储 器 ( 硬 
盘 、 磁 带 机 、Internet) 为 实际 的 主 存储 器 提供 指令 和 数据 。 虚 拟 存储 管理 器 (通常 就 是 操作 
系统 ) 就 能 使 程序 似乎 有 无 限 的 存储 资源 来 运行 和 存储 数据 。 

为 什么 Win 9X、Win 2K 和 Win XP 推荐 使 用 至 少 64~128MB 的 主 存储 器 呢 ? 因为 如 果 计 算 
机 的 物理 存储 资源 太 少 ，PC 就 会 花 时 间 不 停 地 在 内 存 和 硬盘 之 间 来 回 交换 数据 。 之 前 在 关于 
cache 的 讨论 中 ， 我 们 考虑 了 未 命中 所 招致 的 惩罚 ， 就 是 还 要 去 访问 主 存储 器 。 硬 盘 的 平均 访 
问 时 间 大 约 为 lms， 无 cache 的 存储 器 的 平均 访问 时 间 约 为 10ns。 因 此 当 数 据 不 在 RAM 中 ， 需 
要 从 硬盘 中 读 取 时 ,访问 时 间 大 约 要 慢 10-3/10-5=10 000 倍 。 

有 了 虚拟 存储 器 ， 主 存储 器 的 角色 就 是 作为 二 级 存储 器 (一 般 就 是 硬盘 ) 的 cache。 这 一 
技术 的 好 处 是 让 每 个 程序 都 感到 好 像 有 无 限 大 的 物理 存储 量 。 在 这 种 情况 下 ，CPU 发 出 的 都 
是 虚拟 地 址 (virtual address) 。 它 不 知道 这 个 虚拟 地 址 在 物理 存储 器 中 是 否 真 的 存在 ， 或 者 是 
否 实际 地 被 映像 到 了 硬盘 。 也 不 知道 操作 系统 中 是 否 还 有 另外 一 个 程序 目前 已 经 占用 了 这 个 
虚拟 地 址 所 指向 的 物理 存储 空间 。 

有 了 基于 虚拟 存储 器 模型 的 系统 ， 程 序 的 重 定位 就 成 了 建立 可 执行 目标 代码 的 简单 自然 的 方 
法 ， 系 统 就 能 够 给 每 个 程序 分 配属 性 (通常 是 以 保护 方案 的 形式 ) 使 得 两 个 都 在 运行 的 程序 保持 
相互 隔离 。 过 去 有 一 家 叫做 数据 设备 公司 (DEC) 的 企业 提出 了 虚拟 存储 器 的 思想 ， 并 以 此 为 基 
础 建立 了 公司 。DEC VAX 这 个 术语 就 是 这 个 公司 的 同义词 ，VAX 代 表 虚 拟 地 址 扩展 (virtual 
address extension) ， 即 虚拟 存储 器 。 

图 14-12 是 虚拟 存储 器 模型 的 一 
个 简化 示意 图 。 随 着 处 理 器 变 得 越 来 
越 复 杂 ， 我 们 需要 将 CPU 与 其 他 硬件 
如 存储 管理 分 开 来 设计 。 这 样 ，CPU 
只 需 给 数据 或 指令 发 出 地 址 就 行 了 。 

由 于 CPU 并 不 知道 在 某 一 时 刻 程 
序 代码 或 数据 具体 在 什么 地 方 ， 它 给 
出 的 地 址 就 是 虚拟 地 址 (virtual 
address) 。 实 际 存放 的 位 置 可 能 是 指 
令 cache、 数 据 cache、 主 存储 器 或 者 
二 级 存储 器 。CPU 的 功能 就 是 向 系统 
的 其 他 部 分 提供 所 需要 的 虚拟 地 址 。 
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以 直接 检索 到 它 。 如 果 未 能 命中 ， 则 相应 的 硬件 和 操作 系统 将 这 个 虚拟 地 址 映像 到 物理 
CPU 被 阻塞 ， 系 统 从 主 存储 器 中 将 重 存储 器 或 者 二 级 存储 器 (硬盘 ) 上 


虚拟 地 址 物理 存储 地 址 





Ww 
-J 





2 


充 线 读 取 到 cache。 如 果 数 据 也 不 在 主 存储 器 中 ，CPU 就 需要 继续 等 待 ， 直 到 数据 从 硬盘 中 被 
读 和 信 。 然 而 ， 你 将 会 看 到 ， 如 果 数 据 不 在 物理 存储 器 中 ， 指 令 将 被 中 止 ， 操 作 系统 必须 接管 
控制 从 磁盘 取得 虚拟 地 址 。 

由 于 虚拟 存储 器 与 操作 系统 密切 相关 ， 所 以 我 们 用 更 一 般 的 术语 来 描述 CPU 的 可 用 存储 
空间 ， 叫 作 远 辑 存储 器 (logical memory) 。 我 们 以 非常 紧密 关联 的 方式 使 用 逻辑 存储 器 、 物 
理 存储 器 和 虚拟 存储 器 这 三 个 术语 ， 但 它们 之 间 存在 真实 的 差别 ， 其 中 操作 系统 管理 下 的 硬 
盘 也 称 为 虚拟 存储 器 。 我 们 来 仔细 
地 研究 一 下 虚拟 存储 系统 的 组 成 部 指令 逻辑 存储 器 
分 ， 请 看 图 14-13。 

CPU 执行 一 条 指令 时 会 取出 存储 - 

器 中 的 操作 教 ， 程 序 计数 器 也 会 给 出 | 2 的 村 只 可 扯 术 ， 

下 一 条 指令 的 执行 地 址 。 不 管 什么 情 
况 下 ，CPU 都 要 通过 标准 的 寻 址 方式 
( 寻 址 模式 ) 产生 一 个 地 址 。 这 个 地 。 
址 指向 处 理 器 的 逻辑 存储 空间 中 的 一 

个 位 置 。 处 理 器 中 还 有 称 为 存储 管理 储 器 的 转换 组 种 涛 | 物理 存储 器 
单元 (memory management unit, 
MMU) 的 专用 硬件 ， 位 于 CPU 之 外 ， 
它 将 逻辑 地 址 映射 到 计算 机 存储 空间 。 [操作 系统 注 行 只 党 处理 
的 物理 地 址 。 如 果 指 令 发 出 时 ， 给 出 
的 地 址 在 物理 存储 器 中 ， 物 理 存储 器 图 14-13 一 个 虚拟 存储 系统 的 组 成 部 分 

就 满足 这 个 地 址 要 求 。 但 是 ， 不 管 在 

什么 情况 下 ， 采 用 的 都 是 突 发 访问 模式 来 重 填充 cache， 而 不 是 仅仅 取 单 个 字 。 

然而 ， 有 时 候 存储 访问 要 求 不 能 被 满足 ， 因 为 所 需要 的 数据 在 硬盘 的 虚拟 存储 器 中 。 如 果 
处 理 器 中 的 存储 管理 硬件 检测 到 该 地 址 不 在 物理 存储 器 中 ， 就 产生 一 个 异常 。 这 个 异常 类 似 于 
一 个 内 部 产生 的 中 断 ， 不 同 之 处 在 于 一 个 真正 的 中 断 在 中 断 被 接受 之 前 容许 当前 指令 继续 执行 
完毕 。 而 当 一 个 异常 发 生 时 ， 指 令 必 须 马上 中 止 ， 因 为 操作 系统 必须 接管 并 处 理 这 个 异常 请 求 。 

当 讨论 片 上 cache 时 我 们 知道 ， 在 主 存储 器 和 cache 之 间 传输 数据 时 ， 是 以 块 为 单位 ， 块 的 大 小 
为 一 个 重 充 线 时 效率 最 高 ， 一 般 是 64 个 字 节 。 现 在 我 们 讨论 虚拟 存储 器 ， 数 据 可 能 保存 在 硬盘 上 ， 
这 时 我 们 不 得 不 增加 块 的 大 小 ， 因 为 现在 的 不 中 惩罚 要 比 主 存储 器 的 不 中 惩罚 要 多 上 几 千 倍 。 

我 们 知道 ， 硬 盘 是 一 个 带 有 移动 和 旋转 单元 的 机 械 设备 。 最 快 的 硬盘 转速 为 10 000PRM， 大 
约 为 每 秒 钟 167 转 。 如 果 存 在 硬盘 上 磁道 上 的 数据 刚好 错过 了 硬盘 的 读 写 头 ， 我 们 就 不 得 不 再 等 上 
60ms 数 据 再 转 回来 。 此 外 ， 读 写 头 在 磁道 间 移 动 还 需要 大 约 lms 的 时 间 。 因 此 ， 如 果实 在 必须 要 
读 取 虚拟 存储 器 中 的 数据 ， 我 们 就 应 该 读 和 足够 的 数据 ， 这 样 才 值得 我 们 花费 那么 长 的 等 待 时 间 。 

如 果 你 对 硬盘 进行 过 碎片 整理 ， 你 就 会 知道 它 对 性 能 的 提高 有 多 大 。 当 你 不 停 地 在 硬盘 
上 添加 和 删除 数据 之 后 ,硬盘 ( 扁 区 ) 上 可 用 于 存放 程序 和 数据 文件 的 整 块 连续 空间 会 变 得 
越 来 越 少 。 这 就 意味 着 如 果 你 必须 要 从 硬盘 上 检索 存放 在 4 个 扁 区 中 的 数据 (大 约 是 2000 字 节 )， 
这 4 个 扇 区 可 能 分 布 在 硬盘 的 各 个 地 方 。 让 我 们 做 一 个 简单 的 计算 看 看 有 什么 发 现 。 

假设 硬盘 的 读 写 头 从 一 个 磁道 移动 到 下 一 个 磁道 需要 的 时 间 是 5ms。 统 计 表 明 ， 在 一 个 碎 
片 相当 多 的 磁盘 上 ， 两 个 扁 区 之 间 的 平均 距离 为 10 条 磁道 。 这 是 一 个 平均 值 ， 有 时 候 要 访问 
的 数据 刚好 就 在 相 邻 的 柱 面 上 ， 有 了 时候 却 不 是 这 样 的 。 记 住 柱 面 就 是 我 们 正在 访问 的 磁道 ， 
但 考虑 到 硬盘 可 能 会 有 多 个 盘 片 ， 多 个 读 写 头 ， 因 此 一 个 柱 面 可 能 包含 多 个 磁道 。 
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最 后 ， 假 设 每 次 都 必须 要 移动 到 一 个 新 的 柱 面 ， 在 数据 到 达 读 写 头 下 之 前 磁盘 平均 旋转 
1/2 圈 (旋转 延迟 )。 

在 这 样 的 情况 下 ， 我 们 将 需要 等 待 : 

1. 5ms/ 磁 道 x 10 个 磁道 (每 次 访问 磁道 ) 二 1/2x (1/167) =53ms 

2.4 (访问 次 数 ) x 53ms (每 次 访问 时 间 ) = 212ms 

现在 ,假设 数据 位 于 硬盘 上 连续 的 4 个 扁 区 内 。 换 句 话 说 ,硬盘 已 经 进行 过 碎片 整理 。 那 
么 访问 第 一 扇 区 时 ， 读 写 头 移动 的 时 间 和 旋转 的 时 间 都 没有 变化 ， 但 是 接着 访问 剩 下 的 扇 区 
速度 就 快 多 了 。 若 硬盘 的 每 个 磁道 有 64 个 遍 区 ， 转 速 为 10 000rpm， 那 么 读 取 4 个 扁 区 花费 的 
时 间 就 是 (4/64) x (1/167) =374us。 

因此 ， 读 取 数 据 的 时 间 就 是 50ms + 3ms + 374Ms = $3.00374ms， 省 下 了 超过 1S0ms 的 时 间 。 局 
部 性 原则 告诉 我 们 这 样 做 是 非常 明智 的 ， 因 为 我 们 很 可 能 马上 就 需要 所 有 的 这 2000 字 节 的 数据 。 


14.3 页 


在 一 个 虚拟 存储 系统 中 ， 我 们 将 物理 存储 器 和 二 级 存储 器 (硬盘 、 磁 带 机 、 快 内 卡 ) 之 
间作 为 一 个 单位 进行 映像 的 存储 块 称 作 页 (page)。 了 映像 时 虚拟 存储 系统 只 把 程序 中 的 如 下 一 
些 部 分 读 入 物理 存储 器 : 

。 能够 被 存 入 物理 存储 器 的 

。 已 经 被 操作 系统 分 配 的 

。 目前 正在 被 使 用 的 

这 里 我 们 又 看 到 了 分 页 的 运用 。 然 而 ， 分 页 虽然 是 物理 存储 器 中 二 进 制 地 址 的 属性 ， 但 
它 对 于 虚拟 存储 系统 非常 重要 ， 因 为 通常 硬盘 上 的 一 个 遍 区 刚好 自然 地 映像 到 虚拟 存储 器 上 
的 一 个 页 。 我 们 可 以 把 逻辑 地 址 分 为 两 个 部 分 : 

1. 虚拟 页 编号 (页 号 ) 

2. 页 内 的 字 偏 移 (或 者 字 节 偏 移 ) 

回忆 一 下 物理 存储 器 中 分 页 的 例子 。 假 设 有 一 个 16 位 的 地 址 $F79D， 那 么 我 们 可 以 把 它 
表示 成 : 

。 页 号 = F7 

。 字 节 偏 移 = 9D 
这 个 例子 中 我 们 有 256 个 页 ， 每 页 有 256 个 字 节 。 不 同 的 操作 系统 采用 页 的 大 小 不 尽 相 同 。 当 
需要 的 数据 不 在 存储 器 中 时 ， 产 生 一 个 页 故障 (page fault) 的 异常 。 操 作 系 统 (O/S) 必须 接 
管 并 从 硬盘 上 检索 到 需要 的 页 。 正 如 我 们 前 面 讨 论 的 ， 页 故障 意味 着 巨大 的 不 中 惩罚 。 因 此 ， 
我 们 希望 通过 将 页 设计 得 相当 大 ( 璧 如 1 到 8KB ) 以 降低 这 个 损失 。 

操作 系统 (O/S) 通过 MMU 对 页 进行 管理 。 采 用 的 策略 是 将 页 故障 作为 最 高 优先 级 。 一 
次 页 故障 及 其 后 续 的 从 硬盘 到 主 存储 器 的 数据 重 载 和 人 可 能 要 花费 几 十 万 个 时 钟 周 期 ， 所 以 ， 
花 代 价 设 计 一 个 LRU 算 法 是 值得 的 。 在 操作 系统 接管 后 ， 页 故障 可 以 用 软件 而 不 是 硬件 来 处 
理 。 软 件 处 理 的 速度 显然 要 比 硬件 慢 很 多 ， 但 是 灵活 性 要 好 得 多 。 而 且 ， 虚 拟 存储 系统 采用 
回 写 策略 ， 因 为 通 写 策略 的 代价 太 高 。 你 想 过 为 什么 要 通过 关闭 操作 系统 来 关闭 计算 机 吗 ? 
其 原因 就 在 于 操作 系统 在 采用 回 写 策略 来 管理 虚拟 存储 器 。 如 果 你 在 操作 系统 关闭 打开 的 文 
件 之 前 就 直接 关闭 计算 机 ， 你 就 有 可 能 丢失 物理 页 所 存储 的 数据 ， 因 为 这 些 页 有 可 能 还 没有 
回 写 到 虚拟 页 上 ， 就 是 硬盘 上 。 

图 14-14 是 一 个 分 页 系统 的 简化 示意 图 。 由 于 我 们 可 以 简单 地 将 32 位 的 地 址 分 为 页 段 和 偏 
移 段 ， 所 以 接着 我 们 可 以 把 页 段 映像 到 物理 存储 器 或 者 虚拟 存储 器 (硬盘 )。 由 于 硬盘 是 按照 
读 写 头 、 磁 道 和 扁 区 模型 来 存储 数据 的 ， 所 以 我 们 需要 操作 系统 把 硬盘 映像 到 虚拟 存储 器 中 。 
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我 们 将 这 种 系统 称 为 按 需 调 页 虚拟 存储 器 (demand-paged virtual memory) ， 因 为 操作 系统 根 
据 需 要 把 相应 的 页 载 入 到 了 物理 存储 器 中 。 
虚拟 地 址 


0123456789A.....3FE 3FF 





0123456789A.…3FE 3FF 物理 地 址 


图 14-14 分 页 系统 示意 图 。 整 个 虚拟 地 址 被 分 为 页 号 和 页 内 偏 移 两 部 分 。 
虚拟 页 号 被 映像 到 物理 存储 器 和 虚拟 存储 器 上 


由 于 页 故障 的 代价 太 大 ， 所 以 我 们 可 以 每 次 传输 和 存储 多 个 页 。 我 们 将 这 些 物理 存储 块 称 
[B90] “为 页 帧 (page frame)， 它 们 承载 了 从 硬盘 传输 来 的 所 有 页 ， 其 大 小 可 在 1 024 到 8 192 个 字 节 之 
间 。 最 后 ， 正 如 cache 需 要 一 个 标签 存储 器 来 保存 cache 与 主 存储 器 之 间 的 映像 信息 一 样 ， 操 作 
系统 也 维护 着 一 个 页 映像 (page map) ， 用 来 保存 虚拟 存储 器 与 物理 存储 器 之 间 的 映像 信息 。 
此外， 页 映像 中 还 可 能 包含 其 他 一 些 与 当前 正在 运行 的 操作 系统 和 应 用 程序 相关 的 信息 。 
”页 表 (page table) 就 是 页 映像 的 一 部 分 ， 它 为 操作 系统 所 拥有 ， 用 来 记录 当前 正在 使 用 的 页 ， 
以 及 已 经 被 映像 到 物理 存储 器 和 虚拟 存储 器 上 的 页 。 
一 些 页 表 的 表 项 总 结 如 下 : 
。 虚拟 页 号 : 在 页 表 中 的 偏 移 位 置 
。 有效 位 : 页 当前 是 否 在 存储 器 中 
。 脏 位 : 程序 是 否 修改 〈 写 入) 了 页 
。 保 护 位 : 哪些 用 户 (进程 ， 程序) 可 以 访问 该 页 
。 页 帧 号 : 页 在 物理 存储 器 时 的 页 帧 地 址 


14.4 转换 旁 路 缓冲 器 (TLB) 


大 多 数 计算 机 系统 都 把 页 表 保存 在 主 存储 器 中 。 但 处 理 器 还 可 以 包含 一 个 专用 的 寄存 器 ， 
就 是 页 表 基 址 寄存 器 (page-table base register) ， 它 指向 页 表 的 起 始 位 置 。 只 有 操作 系统 使 用 
管理 模式 的 指令 才能 修改 页 表 基 址 寄存 器 。 从 理论 上 讲 ， 对 主 存储 器 (无 cache) 的 访问 需要 
两 次 ， 因 为 每 次 访问 主 存 储 器 时 ， 必 须 首 先 访问 页 表 。 

因此 ， 现 代 处 理 器 还 维护 了 一 个 转换 和 旁 路 缓冲 器 (translation look-aside buffer,TLB ) 作 
为 页 映像 的 一 部 分 。TLB 是 一 个 片上 cache， 通 常 是 全 相 联 的 , 用 于 进行 虚拟 存储 器 管理 。 
TLB 中 保存 有 与 页 表 的 一 部 分 相同 的 信息 ， 把 虚拟 页 号 映像 到 了 页 帧 号 。TLB 中 只 保存 最 近 
访问 的 页 的 信息 ， 最 近 访 问 最 少 (LRU) 的 表 项 将 被 从 TLB 中 删除 。 而 且 TLB 中 只 保存 有 效 
页 的 映像 (不 保存 脏 页 )。 

图 14-15 显 示 了 分 页 系统 的 各 个 组 成 部 分 ， 包 括 片 上 硬件 、TLB 以 及 页 表 基 址 寄存 器 所 指 
向 的 主 存储 器 中 的 页 表 。CPU 产 生 一 个 虚拟 地 址 ， 系 统 首先 在 片上 cache 进 行 检验 和 匹配 。 如 

果 cache 未 命中 ， 那 么 该 指令 的 流水 线 将 被 阻 断 (我 们 假定 这 是 一 个 超标 量 的 处 理 器 ， 其 他 的 
指令 流水 线 仍然 在 处 理 指令 )，cache 的 控制 逻辑 就 通知 TLB 看 一 看 该 页 是 否 在 物理 存储 器 中 。 
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如 果 在 TLB 中 ， 就 由 总 线 逻 辑 从 物理 存储 器 中 检索 该 重 充 线 ， 并 将 其 放 入 到 cache， 然 后 就 可 
继续 进行 处 理 过 程 。 
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| 庶 机 页 号 [vo [保护 码 | 页 由 号 | 
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主 存储 器 中 的 操作 数 
图 14-15 分 页 系统 的 组 成 部 分 〈 由 Baron 和 Higbie 提供 ) 


如 果 页 不 在 TLB 的 列表 中 ， 那 么 处 理 器 就 利用 页 表 基 址 寄存 器 建立 一 个 指针 ， 并 开始 在 
页 表 中 搜索 所 需要 的 页 ， 看 该 页 是 否 在 物理 存储 器 中 。 如 果 在 ， 那 么 TLB 就 被 更 新 ， 重 充 线 
被 检索 到 后 读 入 cache。 如 果 该 页 在 虚拟 存储 器 中 ， 就 必须 产生 页 故障 ， 操 作 系统 就 介入 并 从 
硬盘 中 检索 需要 的 页 ， 并 把 它 放 入 页 帧 。 图 14-16 显 示 了 虚拟 分 页 处 理 的 流程 图 。 
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图 14-16 虚拟 页 访问 过 程 的 流程 图 (由 Heuring 和 Jordan 提供 ) 


14.5 保护 
由 于 虚拟 存储 器 的 有 效 管理 依赖 于 专门 的 硬件 来 支持 分 页 处 理 ， 所 以 需要 讨论 一 下 这 个 
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硬件 必须 提供 的 另 一 个 重要 功能 一 一 保护 不 同 的 内 存 区 域 不 被 有 意 或 者 无 意 地 互相 访问 。 

在 68K 中 ， 我 们 已 经 见 过 一 个 简单 的 保护 方案 ， 就 是 采用 管理 模式 和 用 户 模式 。 当 处 理 器 
处 于 用 户 模式 时 ， 指 令 集 只 有 一 部 分 可 以 被 执行 。 如 果 某 个 程序 试图 执行 一 个 管理 模式 的 指 
令 ， 就 会 产生 异常 。 一 般 来 说 ， 这 个 异常 向 量 就 是 指向 操作 系统 的 一 个 人 口 ， 操 作 系统 将 来 
处 理 这 个 非法 的 指令 。 

此 外 , 我们 还 看 到 68K 支 持 两 个 独立 的 栈 指 针 , 一 个 用 户 栈 指针 和 一 个 管理 栈 指针 。 然 而， 
68K 中 并 没有 一 个 机 制 来 防止 一 个 存储 区 域 被 另 一 个 存储 区 域 非法 访问 。 为 做 到 这 一 点 ， 我 们 
需要 MMU 的 保护 硬件 。MMU 采 用 了 与 CPU 独 立 的 不 同 芯 片 ， 但 是 随 着 集成 度 的 提高 ，MMU 
电路 就 被 合并 在 处 理 器 中 ， 大 多 数 现代 高 性 能 处 理 器 都 有 片上 的 MMU。 

因此 ， 我 们 可 以 把 基于 硬件 的 保护 功能 小 结 如 下 : 

* 用 户 模式 和 内 核 (管理 ) 模式 

* 限制 用 户 只 能 读 取 用 户 / 内 核 模式 位 ， 提 供 从 用 户 模 式 到 内 核 模式 的 切换 机 制 ， 

通过 操作 系统 的 系统 调用 

。TLB 

“页 表 基 地 址 指针 

。 MMU 

最 后 ， 我 们 看 一 下 两 个 现代 的 处 理 器 ， 比 较 一 下 它们 对 MMU、TLB 和 cache 的 支持 ， 如 下 
表 所 示 。 这 里 我 们 不 打算 全 面 研究 这 个 表格 ， 而 只 是 讨论 其 中 最 关键 的 一 个 信息 。 这 个 表格 


一 般 是 
































这 一 章 介绍 的 内 容 有 : 
。 存 储 器 层次 的 概念 。 


“局 部 性 的 概念 以 及 它 如 何 证 明 cache 的 使 用 是 正确 的 。 











是 现今 最 先进 、 最 强大 的 两 种 商业 微 处 理 器 的 数据 总 结 。 现在 这 个 表格 中 比较 两 个 处 理 器 的 
数据 你 应 该 都 能 看 明白 了 。 
特性 Intel Pentium Pro Freescale PowerPC 604 
虚拟 地 址 范围 52 位 
物理 地 址 范围 32 位 
页 大 小 4KB, 4MB 4KB ， 选 择 表 ，256MB 
TLB 组 织 指令 和 数据 的 TLB 分 开 。 两 者 都 是 4 路 组 相 联 的 ， 指令 和 数据 的 TLB 分 开 。 两 者 都 是 
采用 了 伪 LRU 替 换 策 略 。 指 令 TLB :， 32 个 表 项 ， 数 2 路 组 相 联 的 ， 采 用 了 LRU 替 换 策略 。 
据 TLB，64 个 表 项 。TLB 未 命中 由 硬件 处 理 指令 TLB ，128 个 表 项 ， 数 据 TLB : 
128 个 表 项 。TLB 未 命中 由 硬件 处 理 
cache 组 织 指令 cache 和 数据 cache 分 开 指令 cache 和 数据 cache 分 开 
cache 大 小 每 个 8KB 每 个 16KB 
cache 相 联 方式 4 路 组 相 联 4 路 组 相 联 
替换 策略 近似 LRU 替 换 策略 LRU 和 替换 策略 
块 大 小 32 字 节 32 字 节 
写 策 略 回 写 或 者 通 写 
总 结 


，cache 的 主要 类 型 、 直 接 映 像 、 全 相 联 、 组 相 联 和 区 映像 。 
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。 cache 性 能 的 度量 。 
。 虚拟 存储 器 的 体系 结构 。 
。 虚拟 存储 器 的 不 同 组 成 部 分 以 及 操作 系统 是 如 何 管理 虚拟 存储 器 资源 的 。 393 
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习题 


1.a. “存储 器 的 层次 结构 ”是 什么 意思 ? 描述 一 下 它 ， 并 用 一 些 典 型 的 值 来 说 明 。 
b. 什么 是 空间 局 部 性 和 时 间 局 部 性 ? 局 部 性 对 于 片上 cache 的 意义 在 于 什么 ? | 
c. 为 什么 片上 cache 一 次 从 存储 器 读 取 整 个 “ 重 充 线 ”， 而 不 是 仅仅 读 取 需 要 的 指令 或 数据 ? 
d. 比较 一 下 “ 回 写 cache” 和 “ 通 写 cache” 的 结构 。 

2. 与 主 存储 器 相 比 ， 片 上 cache 的 容量 非常 小 ， 然 而 对 大 多 数 程序 而 言 cache 的 命中 率 一 般 都 大 
于 90%。 解 释 一 下 为 什么 会 是 这 样 。 

3. 假 设 下 面 的 C++ 程序 被 编译 后 在 68000 体 系 结构 的 计算 机 上 运行 。 指 令 代码 在 存储 器 中 的 位 
置 是 $00001000 到 $00001020。 变 量 DataStream[10] 被 放 在 堆 存 储 器 中 ， 地 址 范围 是 
$00008000 到 $00008028。 其 他 的 所 有 变量 都 存储 在 从 $FFFFFF00 开 始 的 栈 空间 中 。 请 尽 可 
能 完全 地 解释 下 面 的 程序 是 如 何 表现 出 时 间 局 部 性 和 空间 局 部 性 的 。 


int main (void) 
{ 
int count ; 
const int maxcount = 10 ，; 
int DataStream[10] ; 
for ( count = 0 ; count <= maxcount ; count++ ) 
*(DataStream + count) = count*count }; 
return 0; 


} 
4. 考虑 下 面 的 C++ 变量 声明 和 图 示 。 其 中 的 数字 表示 各 种 数组 元 素 在 存储 器 中 的 字 节 地 址 。 
简单 地 讨论 一 下 ， 这 个 声明 是 否 体现 了 局 部 性 原则 。 


const char *daysArray[7] = { “Sunday", "Monday"， “Tuesday", 
“Wednesday”, “Thursday”, “Friday”, "Saturday", "Sunday" }; 
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假设 你 有 一 个 微 处 理 器 ， 具 有 20 位 的 字 节 地 址 范围 和 16 位 宽 的 数据 总 线 。 处 理 器 有 一 个 片 

上 cache ， 其 特性 如 下 : 

。cache 为 直接 映像 模式 ， 

。cache 大 小 为 4096 字 节 ， 不 包括 标签 存储 器 ， 

。 一 个 重 充 线 的 大 小 为 64 字 节 。 

a. 主 存储 器 中 有 多 少 个 重 充 线 ? 

b. cache 中 有 多 少 个 重 充 线 ? 

c. 对 于 直接 映像 cache， 主 存储 器 应 该 划分 为 多 少 行 和 多 少 列 ? 

d. 为 了 对 主 存储 器 一 行 的 所 有 重 充 线 进行 寻 址 ， 与 cache 相 联 的 标签 存储 器 中 的 地 址 长 度 需 
要 多 少 位 ?不 考虑 脏 数据 位 等 其 他 标志 位 。 

e. 画 出 这 个 cache 组 织 的 草图 。 尽 可 能 全 面 地 显示 存储 器 组 织 的 地 址 部 件 。 


.假设 你 有 一 个 微 处 理 器 ， 具 有 1MB 的 寻 址 范围 和 4KB 的 直接 映像 cache。 在 cache 中 重 充 线 的 


块 大 小 为 64 字 节 。 那 么 ， 

1.cache 中 有 多 少 个 重 充 线 ? 

2. 为 了 与 这 个 cache 设 计 协 调 ， 主 存储 器 应 该 如 何 组 织 (多 少 行 ， 多 少 列 ) ? 

3. 标签 存储 器 所 需 位 数 是 多 少 ? 

4. 假设 你 试图 要 从 地 址 $3FB0A 处 取 一 条 指令 ， 那 么 包含 这 个 地 址 的 重 充 线 的 行 地 址 和 列 地 
址 分 别 是 多 少 ? 


.假设 某 个 RISC 处 理 器 的 片上 cache 的 命中 率 为 98%。 指 令 在 cache 中 时 ， 需 要 一 个 时 钟 周 期 


执行 完毕 。 如 果 指 令 不 在 片上 cache 中 ， 则 导致 处 理 器 暂停 程序 的 执行 ， 并 对 cache 的 某 部 分 
进行 重 填 充 。 这 个 过 程 需要 100 个 时 钟 周 期 。 如 果 该 RISC 处 理 器 的 时 钟 频率 为 100MHz， 问 
有 效 执行 时 间 是 多 少 纳 秒 ? 


.假设 某 个 32 位 RISC 处 理 器 的 片上 cache 的 命中 率 为 98% 。 指 令 在 cache 中 时 ， 需 要 一 个 时 钟 


周期 执行 完毕 。 如 果 指 令 不 在 片上 cache 中 ， 则 导致 处 理 器 暂停 程序 的 执行 ， 采 用 突 发 访问 
模式 从 主 存储 器 中 读 取 一 条 64 字 节 的 重 充 线 ， 并 将 其 写 到 cache。 取 外 存储 器 中 的 数据 每 次 
需要 2 个 时 钟 周期 。 如 果 处 理 器 的 时 钟 频率 为 100MHz， 问 有 效 执行 时 间 是 多 少 纳 秒 ? 


. 考虑 一 下 虚拟 存储 系统 的 各 种 组 件 ， 特 别 注意 TLB 的 结构 。 主 存储 器 中 的 页 表 被 读 入 cache， 


并 且 在 发 生 虚 拟 页 操作 时 都 会 对 其 进行 例 行 更 新 ， 那 么 为 什么 每 个 TLB 的 和 人口 都 需要 一 个 
有 效 位 呢 ? 





第 15 章 计算 机 体系 结构 的 性 能 问题 


学 习 目标 

”硬件 的 各 个 方面 如 何 能 影响 一 个 计算 机 系统 的 性 能 ; 
。 软 /硬件 划分 决策 是 如 何 影响 性 能 的 ， 

。 增 量 式 提高 计算 机 系统 性 能 的 方法 ， 

。 在 测量 计算 机 性 能 时 对 测试 基准 的 利用 和 误 用 ， 

* 测量 性 能 的 方法 ; 

* 一 个 项 目 计划 如 何 能 达到 规定 的 性 能 目标 。 


15.1 引言 


在 一 个 课本 的 一 个 章节 中 要 覆盖 计算 机 性 能 的 主题 ， 篇 幅 是 很 不 够 的 。 然 而 ， 这 在 过 去 
从 来 没 能 阻止 我 ， 所 以 在 深入 进去 之 前 ， 让 我 们 考虑 一 下 这 个 问题 及 其 范围 。 当 我 们 谈 到 性 
能 时 ， 我 确信 你 们 中 的 很 多 人 在 假设 我 所 指 的 是 : 最 新 和 最 好 的 PC 在 一 系列 接 旺 而 来 的 称 为 
测试 基准 的 测试 实例 上 工作 得 怎么 样 。 对 基准 的 测试 可 采取 的 形式 包括 : 对 重新 计算 一 个 大 
电子 数据 表 所 需 的 时 间 进 行 测 量 ， 或 者 对 一 个 特定 的 图 形 密集 的 视频 游戏 在 每 秒 种 所 播放 的 
帧 数 进行 测量 。 如 果 你 选择 PC 的 准则 不 是 电子 数据 表 操 作 或 者 视频 游戏 ， 则 这 两 个 性 能 测试 
基准 的 例子 对 你 可 能 有 效 ， 也 可 能 无 效 。 

如 果 你 的 任务 是 设计 软件 〈 读 这 本 书 的 大 多 数 人 将 来 会 从 事 这 种 工作 ) ， 那 么 你 面临 的 将 
是 性 能 问题 的 不 同方 面 ， 你 的 问题 将 会 变 成 :“ 我 怎样 才能 保证 我 编写 的 软件 满足 设计 规范 所 
提出 的 性 能 要 求 ? ”这 样 ， 你 的 问题 就 不 是 选择 当天 最 热门 的 CPU， 而 是 力图 确保 软件 在 设 
计时 就 能 满足 性 能 目标 ， 即 不 是 通过 高 代价 的 锤炼 代码 或 重新 设计 来 满足 性 能 目标 。 

在 本 章 中 ， 我 们 将 从 三 个 角度 来 考察 性 能 : 

1. 硬件 是 如 何 直接 影响 性 能 的 ? 

2. 你 如 何 测量 性 能 ? 

3. 你 如 何 进 行 性 能 设计 ? 

由 于 本 课程 是 关于 硬件 的 ， 所 以 我 们 先 处 理 第 1 项 。 然 后 ， 我 们 再 考虑 测量 计算 机 系统 性 
能 的 方法 。 最 后 ， 我 们 从 一 个 软件 开发 者 的 角度 来 看 性 能 。 


15.2 硬件 和 性 能 


同样 的 微 处 理 器 ， 既 能 驱动 你 家 里 的 DVD 播放 机 ， 也 能 运行 当今 市 场 上 一 些 最 热门 的 视 
频 游戏 ， 这 看 起 来 有 点 不 太 可 能 。 为 什么 选择 视频 游戏 ?我 们 已 经 逐渐 将 视频 游戏 与 高 性 能 
计算 机 联系 在 一 起 ， 视 频 游戏 杂志 总 在 比较 这 种 计算 机 和 那 种 计算 机 ， 或 者 这 种 视频 卡 和 那 
种 视频 卡 。 当 然 ， 正 因为 我 说 过 的 原因 ， 我 们 能 运行 某 机 器 ， 但 这 不 意味 着 你 愿意 用 它 玩 视 
频 游 戏 。 为 什么 ? 是 因为 动作 速度 慢 得 令 人 难以 接受 。 与 你 的 2GHz Athlon 或 奔腾 相 比 ， 帧 速 
率 可 能 远 小 于 每 秒 1 帧 ， 所 以 屏幕 更 新 很 容易 延迟 。 

是 什么 因素 使 得 视频 游戏 在 一 种 情形 下 慢 得 令 人 难以 接受 ， 而 在 另 一 种 情形 下 却 能 使 你 
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实时 地 玩 游戏 昵 ? 为 了 回答 这 个 问题 ， 让 我 们 实际 地 演习 一 下 如 何 将 一 个 典型 的 基于 pc 的 视 
频 游戏 与 一 个 8 位 计算 机 接口 。 

为 进行 实验 ， 假 设 我 们 有 一 个 具有 10MHz 时 钟 的 8 位 处 理 器 ， 能 对 1MB 的 存储 器 直接 进行 
寻 址 ， 该 处 理 器 是 一 个 单 板 计算 机 的 组 成 部 分 ， 该 单 板 计算 机 带 有 32MB 的 RAM， 还 有 一 个 
视频 芯片 用 于 驱动 标准 PC 监视 器 (VGA)， 该 监视 器 具有 1024 x 768 像 素 的 分 辨 率 和 8 位 的 颜 
色 深度 。 视 频 存储 器 能 够 一 次 显示 一 个 帧 ， 并 映射 到 一 个 3MB 的 存储 块 。 特 殊 的 硬件 可 以 使 
存储 器 成 为 双 工 端口 的 (dual-ported) 这 样 ， 视 频 芯片 就 能 通过 读 存 储 器 来 显示 当前 帧 ， 同 
时 ， 处 理 器 可 通过 向 存储 器 块 写 数据 来 更 新 视频 帧 ， 并 且 从 某 存储 器 地 址 读数 据 。 外 部 硬件 
被 映射 为 1O 后 ， 就 成 了 基 存储 器 指针 ， 所 以 ， 通 过 向 该 硬件 寄存 器 写 数据 就 可 以 使 处 理 器 能 
在 任何 1MB 边 界 上 直接 对 存储 器 进行 读 写 。 最 后 ， 视 频 芯 片 仅 支持 从 视频 存储 块 到 屏幕 的 映 
射 过 程 。 在 视频 芯片 内 部 没有 做 图 形 处 理 。 

我 们 首先 面临 的 问题 是 8 位 微 处 理 器 不 太 可 能 与 PC 有 相同 的 指令 集体 系 结构 (ISA) ( 除 
非 我 们 选择 一 个 4.77MHz 的 Intel 8088 处 理 器 ) ， 所 以 我 们 需要 去 访问 视频 游戏 生产 商 ， 说 服 他 
们 给 我 们 游戏 的 C++ 源 代码 。 当 然 ， 他 们 将 立即 同意 我 们 的 请 求 ， 使 问题 得 以 解决 。 下 一 步 ， 
我 们 需要 用 我 们 的 ISA 重 写 游戏 的 汇编 语言 程序 。 

所 有 的 操作 系统 调用 和 图 形 例 程 也 需要 重 写 和 重 编译 。 由 于 我 们 只 有 1MB 存 储 器 模型 ， 
所 以 我 们 需要 获得 编译 器 和 链接 器 映像 的 汇编 语言 输出 ， 并 将 汇编 语言 指令 插入 到 代码 中 ， 
在 1MB 边 界 上 形成 一 个 桥梁 。 每 次 代码 必须 要 穿越 一 个 边界 时 ， 我 们 就 插入 1O 调 用 以 重新 映 
射 基地 址 指针 。 

最 后 ， 我 们 需要 写 图 形 引擎 仿真 器 驱动 程序 ， 使 得 视频 正确 地 显示 在 屏幕 上 。 假 设 我 们 
完成 了 所 有 这 些 任务 ， 现 在 你 觉得 困惑 的 是 整个 这 套 系统 是 多 么 昌 策 ， 而 你 认为 我 们 只 要 将 
游戏 加 载 到 板 上 让 它 跑 就 行 了 。 实 际 上 ， 它 不 会 跑 ， 它 会 非常 地 慢 ， 慢 到 我 们 无 法 玩 游戏 。 
但 是 问题 是 ， 它 还 在 运行 。 代 码 做 了 为 它 设 计 的 工作 ， 程 序 并 没有 崩溃 ， 但 是 性 能 糟 透 了 。 

让 我 们 将 PC 和 8 位 单 板 计算 机 (SBC) 的 性 能 规范 做 一 个 比较 。 下 面 的 表 列 出 了 两 个 系统 
的 主要 不 同 之 处 。 我 们 可 以 看 到 ， 结 果 确实 对 8 位 SBC 很 不 利 。 在 初学 者 看 来 ，PC 的 时 钟 速度 
是 SBC 时 钟 速度 的 200 倍 。 不 过 ， 这 里 我 们 需要 加 一 点 小 心 ， 因 为 PC 时 钟 速 率 是 CPU 的 内 部 时 
钟 速率 。 对 于 PC3200 DDR 存 储 器 ， 外 部 存储 器 的 时 钟 速度 的 典型 值 为 200MHz。 





参 数 PC SBC 注释 
时 钟 速度 2 000MHz 10MHz 
数据 总 线 宽度 32 位 8 位 
可 寻 址 存储 器 4 096MB 32MB 
每 条 指令 时 钟 数 <1 8~20 PC 上 的 CPU 有 多 级 流水 线 
浮 点 计算 在 硬件 中 无 片上 FPU 
cache 片上 cache 和 D-cache 无 
外 部 存储 器 256MB 32MB 不 是 一 个 因素 
图 形 加 速 在 视频 卡 上 无 





同样 ， 如 果 PC 外 部 存储 器 是 SDRAM， 那 么 ， 对 每 次 大 量 的 存储 器 载 和 就 需要 若干 个 时 
钟 周期 。 然 而 ， 片 上 cache 使 外 部 存储 器 的 载 入 保持 到 了 最 小 。 我 们 不 能 准确 地 说 出 cache 的 命 
中 率 ， 但 90% 大 概 是 一 个 公平 的 猜测 。 

我 们 能 假设 较 快 的 时 钟 就 等 同 于 更 好 的 性 能 吗 ? 在 本 例 中 ， 它 确实 是 一 个 主要 的 因素 ， 
但 我 们 能 一 般 化 地 说 较 快 的 时 钟 就 等 同 于 更 好 的 性 能 吗 ? 在 做 比较 的 测试 基准 上 ， 一 个 具有 





3.2GHz 时 钟 速度 的 Intel 奔腾 4 处 理 器 与 一 个 AMD 3000+ Athlon 处 理 器 有 类 似 的 性 能 结果 ， 但 
Athlon 的 实际 时 钟 频率 大 约 是 2.2GHz。 

这 就 产生 了 对 AMD 的 感知 问题 。 对 大 多 数 PC 购 买 者 来 说 ， 时 钟 频率 就 等 同 于 性 能 '。 为 
保持 竟 争 力 ，AMD 被 迫 采 用 了 一 种 虚拟 时 钟 频率 3000 + 。 它 是 虚拟 的 ， 因 为 它 的 意思 是 : 
AMD 的 产品 性 能 比 工 作 于 3000MHz 真 实时 钟 频率 的 奔腾 处 理 器 性 能 要 好 一 点 〈+ 的 意思 ) 。 

知道 了 关于 流水 线 处 理 器 的 原理 ,我们 就 会 猜测 ， 与 Intel 奔 腾 体 系 结构 相 比 较 ，AMD 
Athlon 的 体系 结构 一 定 是 让 处 理 器 在 每 个 流水 线 阶段 做 了 “更 多 ”的 工作 。 然 而 ， 正 因为 它 
做 得 更 多 ， 它 不 得 不 运行 得 更 慢 。 这 样 ， 两 个 部 件 的 时 钟 频率 就 有 了 一 个 差别 。 

除了 桌 上 计算 环境 ， 大 多 数 计算 机 系统 都 力图 运行 得 尽量 慢 ， 而 不 是 尽量 快 。 对 于 基于 
CMOS 技 术 的 处 理 器 来 说 ， 速 度 等 同 于 功率 耗 散 。 图 2-15 表 明 功 率 耗 散 随 CMOS 处 理 器 时 钟 频 
率 的 增加 而 近乎 线性 增加 。 时 钟 频率 的 增加 也 带 来 了 系统 成 本 的 相应 增加 。 一 个 更 快 的 处 理 
器 要 求 更 快 的 支持 芯片 和 更 快 的 存储 器 。 随 着 速度 提高 ， 功 耗 需求 也 会 提高 。 更 快 的 总 线 速 
度 也 意味 着 更 有 可 能 出 现 无 线 电 频率 干涉 (radio frequency interference, RFI) ， 就 需要 做 更 多 
的 工作 ,将 电磁 屏蔽 (electromagnetic shielding) 结合 进 产 品 中 来 抑制 RFI 的 发 射 。 如 果 你 曾 
经 惊讶 于 为 什么 商业 客机 乘客 舱 的 所 有 电子 设备 在 10 000 英 尺 高 度 以 下 必须 关闭 ， 这 就 是 原 
因 ， 航 班 和 联邦 航空 局 (FAA) 担心 在 起 飞 和 着 陆 过 程 中 这 些 电子 设备 可 能 会 与 导航 设备 发 
生 干 涉 ， 所 以 他 们 要 求 关 闭 所 有 电子 设备 (意味 着 所 有 带 有 了 时钟 振荡 器 的 东西 )。 

由 于 大 多 数 代 入 式 系统 都 是 高 度 注 重 成 本 的 ， 所 以 性 能 与 CPU 时 钟 速 度 几乎 是 呈 逆 向 关 
系 的 。 一 个 嵌入 式 设 计 小 组 可 能 会 问 的 问题 是 :“ 为 了 把 工作 做 好 ， 我 们 可 以 使 处 理 器 运行 得 
多 慢 ? ”对 于 他 们 来 说 ， 重 要 的 是 性 能 的 度量 ， 而 不 是 速度 的 度量 。 

甚至 连 Intel] 这 个 “时 钟 频 率 等 于 性 能 ”团体 的 领导 者 也 在 寻找 其 他 方式 来 解决 其 处 理 器 
在 未 来 的 性 能 问题 。Rattner 描 述 了 在 Intel 的 一 个 “右倾 ”做 法 。 公 司 的 Centrino 处 理 器 采用 
了 Banias CPU 技术 ， 该 技术 关注 于 在 研制 过 程 的 每 一 步 限 制 功率 消耗 ， 而 不 是 提高 时 钟 的 速 
度 。Intel 的 未 来 处 理 器 将 以 多 CPU 核 并 行 运转 为 特色 ， 而 不 是 继续 提高 时 钟 速度 。 

另 一 个 浪费 性 能 的 地 方 归 因 于 数据 总 线 宽度 。8 位 宽 的 数据 总 线 只 能 处 理 范 围 在 一 128 到 
127 之 间 的 整数 。 任 何 更 小 的 负数 或 更 大 的 正 数 将 需要 多 次 存储 器 访问 。 这 样 ， 数 据 总 线 越 宽 ， 
系统 访问 存储 器 的 效率 就 越 高 ，CPU 在 内 部 移动 和 操作 数据 就 越 有 效率 。 对 于 除了 ASCII 字 符 
串 操 作 的 大 多 数 处 理 算法 ， 数 据 总 线 宽度 加 倍 能 将 性 能 提高 到 2 至 4 倍 之 间 。 

有 更 宽 的 总 线 就 意味 着 在 每 次 访问 中 可 在 CPU 和 存储 器 之 间 移 动 更 多 数据 。 虽 然 奔腾 和 
Athlon 处 理 器 是 32 位 机 器 ， 但 它们 的 外 部 存储 器 总 线 宽 是 64 位 ， 这 使 之 能 达到 每 秒 3.2GB 的 数据 
传输 速率 。 我 们 如 何 达 到 这 一 点 呢 ? 采用 PC3200 SDRAM 存 储 器 ， 我 们 能 够 在 200MHz 存 储 器 时 
钟 的 每 个 相位 都 传输 数据 ， 这 就 达到 了 400MHz 的 数据 传输 速率 。 这 样 ， 每 个 存储 器 周期 我 们 都 
能 并 行 发 送 或 接收 两 次 8 个 字 节 ， 这 等 于 8 x 2 x 200MHz， 即 3200MB/sec。 而 且 ， 有 直接 访问 4GB 
存储 器 的 能 力 就 意味 着 在 每 次 穿 过 1MB 存 储 器 边界 时 ， 存 储 器 访问 将 不 需要 分 页 指令 的 开销 。 

由 于 8 位 处 理 器 没有 片上 cache， 外 部 存储 器 是 唯一 的 存储 器 ， 所 以 ， 所 有 的 存储 器 访问 都 
根据 处 理 器 的 读 取 存 储 器 模型 来 进行 。 我 们 可 以 假设 对 于 每 次 存储 器 访问 ，CPU 需 要 最 少 4 个 时 
钟 周 期 。 为 简化 ， 我 们 还 假设 ， 我 们 的 32MB 存 储 器 是 0 时 间 等 待 状态 的 存储 器 ， 所 以 ， 所 有 的 


存储 器 访问 就 需要 刚好 4 个 时 钟 来 完成 一 次 读 或 写 。 这 样 ， 从 存储 器 读数 据 将 会 以 每 秒 2.SMB 的 


速率 进行 ， 比 PC 慢 1280 倍 。 但 等 一 下 ， 事 情 越 来 越 精 了 。 由 于 PC 上 的 CPU 具有 片上 指令 cache 
和 数据 cache， 所 以 对 操作 数 和 指令 的 访问 将 以 处 理 器 的 全 内 部 时 钟 速度 ( 即 2GHz) 进行 。 
下 面 我 们 有 一 个 有 趣 的 差别 需要 考 虚 。PC 的 CPU 包 含 一 个 片上 浮 点 数学 运算 加 速 器 和 专 
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用 浮 点 寄存 器 。8 位 处 理 器 必须 用 算法 仿真 所 有 的 浮 点 指令 ， 这 些 指令 对 表示 成 浮 点 的 数 执行 
整数 算术 操作 。 我 们 在 下 一 章 很 快 就 会 看 到 ， 相 比 于 通用 编程 方法 ， 专 用 硬件 能 极 大 地 加 速 
算法 的 运行 。 

最 后 ， 在 PC 的 视频 卡 上 以 图 形 加速 器 形式 存在 的 片 外 支持 硬件 ， 使 得 图 形 密集 的 操作 负 

[9 担 从 CPU 中 解放 出 来 。8 位 处 理 器 必须 自己 计算 所 有 的 图 形变 换 。 

从 这 个 讨论 中 我 们 知道 ， 硬 件 体系 结构 对 性 能 的 影响 不 能 达到 最 小 化 。 粗 略 估算 ，PC 的 
视频 速率 是 每 秒 75 帧 ， 而 8 位 处 理 器 的 视频 速率 是 小 于 每 秒 1 帧 。 虽 然 这 是 一 个 荒唐 可 笑 的 例 
子 , 但 它 在 有 关 硬 件 和 性 能 的 重要 问题 中 确实 是 主要 因素 。 让 我 们 试看 来 总 结 一 下 : 

。 更 快 的 时 钟 速率 通常 意味 着 更 高 的 性 能 ， 但 并 不 全 部 是 这 种 情况 。 

。 更 大 的 总 线 宽度 意味 着 在 每 次 操作 中 能 移动 更 多 数据 ， 并 且 每 条 指令 能 操纵 更 多 数字 。 

。 更 大 的 可 寻 址 存储 器 意味 着 更 高 效 的 存储 器 访问 。 

。 多 流水 线 意味 着 CPU 在 每 个 时 钟 周期 常常 能 完成 多 于 1 条 指令 的 执行 。 

。 片 上 cache 以 时 钟 的 速度 提供 指令 和 数据 。 

。 专 用 的 片上 硬件 ， 如 浮 点 单元 ， 大 大 地 加 快 了 那些 将 数 表示 成 浮 点 格式 进行 操作 的 指 

令 的 执行 速度 。 
.专用 的 片 外 硬件 加 速 器 ， 如 图 形 处 理 器 .声音 芯片 、 以 太 网 芯片 等 等 ， 能 够 使 CPU 免 
除 IO 数 据 处 理 的 负担 。 

这 些 要 点 中 有 对 你 产生 重大 启发 的 吗 ? 可 能 没有 ， 但 你 不 能 确信 。 至 少 我 们 对 它们 进行 
了 逐一 的 列举 。 然 而 ， 有 一 个 有 趣 的 概念 隐藏 在 以 上 的 讨论 中 ， 我 们 需要 对 其 进行 更 深入 一 
点 的 考察 。 在 两 个 例子 中 ,我 们 考虑 了 如 何 用 专门 硬件 加 速 浮 点 运算 和 图 像 操 作 计 算 。 用 硬 
件 对 算法 加 速 是 实现 更 高 性 能 的 通常 做 法 。 图 15-1 示 意 出 了 这 个 原理 。 







一 一 一 一 一 一 
要 打印 的 数据 


图 15-1 将 图 像 打 印 到 一 个 激光 打印 机 的 算法 的 一 般 模 型 。 由 Berger 提供 


在 这 个 算法 中 ， 以 图 像 信息 形式 表示 的 数据 由 激光 引擎 接收 ， 该 信息 用 于 控制 光敏 鼓 对 
激光 束 的 曝光 。 哪 里 激光 束 被 写 到 鼓 上 ， 精 细 颗 粒 的 黑 碳 粉 就 附着 于 哪里 的 感光 区 域 。 然 后 
这 个 图 像 就 转移 和 溶化 到 普通 的 纸张 上 ， 从 而 得 到 打印 机 的 输出 。 

在 描述 这 个 算法 时 ， 我 们 确实 提 及 到 一 些 硬件 ， 但 成 像 过 程 本 身 有 意 地 未 予 明确 说 明 。 
数据 的 位 是 如 何 转换 成 调制 激光 光束 的 呢 ? 我 们 可 以 在 软件 中 做 这 件 事 ， 或 者 我 们 可 以 想像 
由 某 种 专门 硬件 为 我 们 做 这 种 转换 。 事 实 上 ， 目 前 两 种 方法 都 有 广泛 的 使 用 ， 不 同 厂商 可 采 
用 不 同 的 性 能 策略 来 达到 有 竞争 力 的 结果 。A 公 司 可 能 关注 于 精细 地 调整 他 们 的 软件 算法 ， 而 

B 公 司 可 能 通过 采用 不 那么 强大 的 处 理 器 来 缓和 软件 处 理 要 求 ， 但 要 用 专用 硬件 加 速 器 来 加 速 
转换 过 程 〈 称 为 banding) 。 

目前 ， 存 在 第 三 种 选择 。 由 于 在 PC 上 可 得 到 如 此 强 的 处 理 能 力 ， 很 多 打印 机 厂商 只 需 给 
打印 机 配备 必要 的 最 小 化 智能 器 件 ， 这 使 得 激光 打印 机 的 价格 大 幅度 下 降 。 所 有 的 处 理 需 求 
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都 已 放 回 到 了 PC 的 打印 机 驱动 程序 中 。 

我 们 将 这 个 现象 称 为 软件 和 硬件 的 对 偶 性 (duality) ， 因 为 使 用 它们 中 任何 一 个 (或 者 两 个 
都 用 ) 均 可 实现 算法 。 算 法 在 软件 (低速 、 低 成 本 、 灵 活 的 ) 和 硬件 (快速 、 高 成 本 、 严 格 定义 
的 ) 之 间 的 划分 要 由 规划 师 和 设计 师 来 决定 。 这 种 对 偶 性 不 是 非 黑 即 白 ， 它 代表 的 是 各 种 折 中 和 
设计 决策 结果 的 一 个 谱系 。 图 15-2 图 示 了 从 专用 硬件 加 速 到 只 用 软件 加 速 的 一 个 连续 的 范围。 

因此 ， 我 们 可 以 换 一 个 角度 来 看 
待 性 能 问题 。 我 们 可 以 问 :“ 必 须 在 
体系 结构 上 做 什么 样 的 折 中 才能 达到 
期 望 的 性 能 目标 吗 ?” 软件 

随 着 硬件 描述 语言 的 出 现 ， 我 们 一 
现在 就 能 像 设计 软件 一 样 ， 通 过 只 关 个 芒 基 i 
注 算法 来 设计 硬件 了 。 我 们 可 采用 可 编程 不 灵活 
面向 对 象 的 设计 技术 和 基于 UML 的 图 15.2 硬件 页 件 折 中 
工具 来 生成 C++ 或 HDL 源 文件 作为 设 
计 的 输出 。 有 了 这 些 用 于 在 设计 过 程 中 对 硬件 进行 精细 调节 的 方法 ， 随 着 算法 平滑 地 在 软件 
组 件 和 硬件 组 件 之 间 的 划分 ， 性 能 改进 就 成 了 逐步 可 达到 的 目标 。 


超频 


一 种 非常 有 趣 的 亚 文 化 已 经 发 展 起 来 了 ， 它 通过 对 处 理 器 、 存 储 器 或 处 理 器 和 存储 器 进 
行 超频 (overclocking) 来 提高 性 能 。 超 频 的 意思 是 有 意识 地 用 比 设计 时 假定 的 时 钟 速度 更 高 


变 慢 变 快 





的 速度 运行 。 现 代 PC 的 母 板 具有 令 人 惊异 的 灵活 性 ， 使 有 知识 的 或 不 那么 有 知识 的 用 户 都 能 


滥用 如 时 钟 频率 、 总 线 频率 、CPU 核 电压 以 及 LO 电压 这 些 东 西 。 

在 Web 上 搜索 一 下 ， 你 就 会 发 现 很 多 关于 这 个 有 趣 技术 的 专门 web 站 点 。 每 年 我 教 的 很 多 
学 生 都 会 问 我 这 个 问题 ， 所 以 我 认为 本 章 应 该 讲 讲 这 个 问题 。 由 于 超频 从 定义 上 违反 了 制造 
商 的 设计 规范 ， 所 以 CPU 制 造 商 想方设法 阻止 这 些 狂热 者 ， 虽 然 结果 通常 是 混乱 的 。 

现代 CPU 通常 将 内 部 时 钟 频率 锁 相 (phase lock) 到 外 部 总 线 频率 。 一 个 称 为 锁 相 环 
(phase-locked loop, PLL) 的 电路 产生 内 部 时 钟 ， 其 频率 是 外 部 时 钟 频率 的 倍数 。 如 果 外 部 时 
钟 频率 是 200MHz (PC3200 存 储 器 ) ， 乘 因子 是 11， 和 那么 内 部 时 钟 频率 就 是 2.2GHz。PLL 然 后 
将 其 内 部 时 钟 频 率 除 以 11， 并 将 除 后 得 到 的 频率 与 外 部 频率 比较 ， 这 个 局 部 频率 差异 就 用 于 
加 速 或 减 慢 内 部 时 钟 频率 。 

你 可 以 通过 下 面 两 种 方法 之 一 来 实现 处 理 器 超频 : 

1. 改变 CPU 的 内 部 乘 因 子 ， 

2. 提高 外 部 参考 时 钟 频率 。 

CPU 制造 商 是 通过 使 用 硬 连 线 将 该 乘 因子 连接 到 一 个 固定 值 来 解决 这 个 问题 的 ， 虽 然 有 
进取 心 的 爱好 者 已 经 想 出 了 打破 这 个 固定 值 的 方法 。 如 果 母 板 支持 相关 特性 ， 那 么 改变 外 部 
时 钟 频率 就 相对 容易 做 ， 而 且 很 多 配件 市 场 的 母 板 生产 商 已 经 加 入 了 这 些 特性 以 迎合 想 超 频 
的 团体 大 众 。 一 般 来 说 ， 当 你 改变 了 外 部 时 钟 频率 时 ,: 你 也 就 改变 了 存储 器 的 时 钟 频率 。 

好 ， 那 么 ， 不 好 的 方面 是 什么 呢 ?” 简 单 的 回答 是 CPU 的 设计 规范 中 没有 比 规定 速度 运行 更 快 
的 情况 ， 所 以 如 果 你 要 那样 做 ， 就 违反 了 设计 规范 。 让 我 们 更 深入 地 看 一 下 这 个 问题 。 一 个 集成 
电路 要 设计 成 在 规定 的 温度 范围 内 满足 所 有 的 性 能 参数 。 例 如 ，AMD 的 Athlon 处 理 器 规定 要 在 摄 
氏 90 度 以 下 满足 其 参数 的 设计 规范 。 通 常 ， 在 芯片 的 操作 温度 范围 内 ， 每 个 时 序 参数 用 三 个 参数 
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来 规定 : 最 小 值 、 典 型 值 及 最 大 值 (最 坏 情 况 )。 这 样 ， 如 果 你 取 来 大 量 芯 片 并 将 它们 放置 在 昂 
贵 的 参数 检测 机 器 上 ， 你 将 发 现 大 部 分 芯片 的 时 序 参数 都 呈现 钟 形 的 曲线 。 曲 线 的 峰值 围绕 着 典 
型 值 ， 最 大 值 和 最 小 值 之 间 的 大 概 范围 就 定义 了 典型 值 的 两 侧 。 最 后 ， 你 将 芯片 温度 变 得 越 低 ， 
它 运行 得 越 快 。 器 件 物理 学 告诉 我 们 ， 当 芯片 变 热 时 ， 集 成 电路 中 的 电 迁 移 就 会 变 慢 。 

如 果 你 近 距 离 地 观察 一 个 充满 刚刚 流 片 的 Athlon 或 奔腾 的 IC 圆 片 ， 那 么 你 还 会 发 现 有 一 
些 外 表 不 同 的 芯片 均匀 地 分 布 在 圆 片 的 表面 上 。 这 些 芯 片 就 是 实际 用 来 表征 制造 的 每 一 批量 
圆 片 的 参数 的 蕊 片 。 这 样 ， 如 果 制 造 过 程 恰 好 进行 顺利 ， 那 么 你 就 会 得 到 一 批 比 典型 CPU 更 
快 的 CPU。 如 果 该 过 程 勉强 可 接受 ， 那 么 你 得 到 的 可 能 就 是 一 批 比 典 型 芯片 慢 的 CPU。 

假设 你 作为 一 个 制造 者 已 经 确实 很 好 地 调节 了 制造 过 程 ， 使 得 制造 出 的 所 有 芯片 都 比 平 
均 情 况 下 制造 的 好 得 多 。 你 要 怎么 做 呢 ? 如 果 你 曾 买 了 一 台 个 人 计算 机 ， 或 者 用 部 件 组 装 了 
一 台 个 人 计算 机 ， 你 就 会 知道 更 快 的 电脑 价格 就 更 贵 ， 因 为 CPU 制造 商 为 更 快 的 部 件 设 定 了 
更 高 的 价格 。 这 样 ， 一 个 速率 为 3200+ 的 Athlon XP 处 理 器 就 比 一 个 速率 为 2800+ 的 Athlon XP 
处 理 器 更 快 ， 价 格 也 应 该 更 贵 。 但 是 ， 假 设 制造 的 都 是 真正 的 快速 器 件 ， 由 于 仍然 需要 提供 
具有 不 同 价位 的 器 件 ， 你 就 要 将 较 快 的 芯片 标记 为 较 慢 的 芯片 。 

因此 ， 超 频 可 能 采用 如 下 的 策略 : 

1. 加 速 处 理 器 ， 这 既 可 能 由 于 制造 商 保守 地 标定 速率 ， 也 可 能 由 于 市 场 或 销售 的 原因 而 
有 意 地 将 速率 标定 得 小 于 其 实际 性 能 。 

2. 加 速 处 理 器 ， 提 高 系统 的 冷却 能 力 ， 以 尽 可 能 保持 芯片 冷却 ， 使 其 能 应 付 更 高 时 钟 频 
率 所 产生 的 额外 热量 。 
， 3, 提高 CPU 核 的 电压 或 IO 的 电压 或 者 两 者 都 提高 ， 以 降低 逻辑 信号 上 升 和 下 降 的 时 间 。 
这 样 做 的 后 果 是 增加 了 芯片 产生 的 热量 。 

4. 提高 时 钟 频率 直到 计算 机 变 得 不 稳定 ， 然 后 再 退回 某 些 值 。 

5. 提高 时 钟 频率 、 核 的 电压 以 及 IO 电压 直到 芯片 自己 毁坏 。 

超频 的 危险 现在 就 应 该 很 清楚 了 : 

1. 运行 时 ， 芯 搬 越 热 就 越 有 可 能 失效 。 

2. 依赖 典型 的 样本 不 能 保证 在 所 有 温度 和 参数 条 件 下 的 性 能 。 

3. 突破 制造 商 规定 的 阔 值 将 使 你 失去 保障 。 

4. 你 的 计算 机 可 能 勉强 运行 稳定 ， 但 对 故障 和 干扰 高 度 敏 感 。 | 

那么 ， 你 应 该 为 了 提高 性 能 而 对 你 的 计算 机 进行 超频 吗 ? 下 面 的 方针 有 助 于 回答 这 个 问 
题 ; | 

如 果 你 用 PC 是 一 种 业余 爱好 行为 ， 如 玩 游戏 ， 则 可 以 尽 一 切 办 法 进行 超频 实验 。 但 是 ， 如 
果 你 要 PC 做 真正 的 工作 ， 就 不 要 冒险 进行 超频 。 如 果 你 真 想 提高 PC 的 性 能 ， 就 多 加 一 些 存储 器 。 


度量 性 能 


在 个 人 计算 机 和 工作 站 的 世界 中 ， 性 能 度量 通常 是 留 给 其 他 组 织 来 做 的 。 例 如 ， 大 多 数 人 
都 熟悉 SPEC 系 列 这 一 套 软 件 测试 基准 。SPECint 和 SPECfp 这 两 个 测试 基准 分 别 用 来 度量 整数 和 
浮动 数 运算 的 性 能 。SPEC 是 标准 性 能 评估 公司 (Standard Performance Evaluation Corporation) 
的 缩写 ， 这 是 一 个 由 计算 机 制造 商 、 系 统 集 成 商 、 大 学 以 及 其 他 研究 机 构 所 组 成 的 非 合 利 性 团 
体 。 他 们 的 目标 是 为 计算 机 系统 建立 、 维 护 和 发 布 一 组 相关 的 测试 基准 以 及 测试 基准 的 结果 4。 

为 回应 “为 什么 使 用 测试 基准 ? ”这 个 问题 ，SPEC 的 常见 问题 (Frequently Asked 
Question) 那 一 页 写 到 : 
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在 理想 上 ， 最 好 的 系统 对 比 测 试 环境 应 该 是 你 自己 的 应 用 并 采用 你 自己 的 工作 

和 负荷。 但 不 幸 的 是 ， 要 为 你 自己 的 应 用 和 采用 你 自己 的 工作 负荷 进行 不 同系 统 的 比 

较 ， 想 得 到 有 广泛 基础 的 可 靠 的 、 可 重复 的 、 可 比较 的 度量 常常 是 很 困难 的 。 这 可 

能 是 由 时 间 、 人 金钱 、 保 密 或 其 他 限制 等 原因 所 造成 的 。 

这 里 的 关键 是 ， 最 好 的 基准 测试 就 是 你 实际 的 计算 环境 。 然而， 很 少 有 要 买 PC 的 人 有 了 时 
闻 和 倾向 去 将 他 们 所 有 的 软件 装 和 若干 台 计 算 机 中 ， 然 后 对 每 个 机 器 运行 几 天 他 们 自己 的 应 
用 软件 ， 以 此 得 到 对 每 个 系统 相对 能 力 的 感性 认识 。 因 此 ， 我 们 倾向 于 让 其 他 人 ， 通 常 是 计 
算 机 制造 商 或 者 是 第 三 方 评论 者 来 为 我 们 做 基准 测试 。 即 使 在 这 时 ， 在 绝对 公平 的 赛场 上 ， 
要 比较 几 台 机 器 也 几乎 是 不 可 能 的 。 潜 在 的 差异 可 能 包括 : 

。 每 台 机 器 的 存储 量 不 同 。 

。 每 台 机 器 的 存储 器 类 型 不 同 (PC2700 和 PC3200 不 同 )。 

。 CPU 的 时 钟 速率 不 同 。 

。 硬件 驱动 程序 的 修正 版 本 不 同 。 

。 视频 卡 不 同 。 

。 硬盘 驱动 器 不 同 〈 串 行 ATA 或 者 并 行 ATA，SCSI 或 者 RAID ) 。 

一 般 来 说 ， 我 们 会 给 予 我 们 正在 采用 或 打算 采用 的 应 用 类 似 的 测试 基准 以 更 多 的 信任 。 
因此 ， 如 果 你 有 兴趣 为 一 个 动画 工作 室 购 买 高 性 能 工作 站 ， 你 就 可 能 要 从 SPEC 提 供 的 图 形 测 
试 套 组 中 选择 。 

在 风 入 式 的 世界 中 ， 性 能 度量 和 测试 基准 要 更 加 难以 获得 和 弄 清 楚 ， 基 本 原因 是 修 入 式 
系统 不 是 像 工 作 站 和 PC 那样 的 标准 平台 。 几 平 每 个 侯 入 式 系 统 在 CPU、 时 钟 速度 、 存 储 器 、 
支持 芯片 、 使 用 的 编程 语言 、 使 用 的 编译 器 ， 以 及 使 用 的 操作 系统 方面 都 是 独 具 特 点 的 。 

由 于 大 多 数 伐 入 式 系 统 对 成 本 是 极其 敏感 的 ， 所 以 在 设计 系统 时 ， 除 了 实际 恰好 所 需 以 
外 ,理论 上 通常 就 很 少 或 没有 提高 性 能 的 余地 。 而 且 ， 几 入 式 系 统 通常 是 用 于 实时 控制 应 用 
中 ， 而 不 是 计算 应 用 中 。 因 为 系统 的 性 能 会 受 外 界 特性 和 实时 事件 频率 的 严重 影响 ， 所 以 这 
些 事件 必须 在 明确 定义 的 时 间 范 围 内 得 到 服务 ， 否 则 整个 系统 可 能 会 出 现 灾 难 性 的 故障 。 

想像 你 正在 为 一 个 新 式 的 由 电子 控制 的 喷气 式 战 斗 机 设计 一 个 飞行 控制 系统 。 飞 行 员 不 
是 以 传统 的 方式 控制 飞机 ， 因 为 从 座舱 到 飞行 控制 表面 没有 直接 的 缆 线 连接 。 飞 行 员 通过 控 
制 杆 和 方向 舵 踏板 向 飞行 控制 计算 机 (或 多 个 计算 机 ) 发 出 请 求 ， 计 算 机 响应 请 求 ， 对 爵 面 
和 尾 面 作出 调整 。 使 飞机 具有 如 此 高 机 动 性 的 因素 也 正 是 使 它 难 以 飞翔 的 因素 。 使 飞机 具有 
如 此 高 机 动 性 的 因素 也 正 是 使 它 难以 飞翔 的 因素 。 没 有 计算 机 对 飞机 状态 的 持续 监视 以 及 对 
飞行 控制 表面 的 快速 调整 ， 飞 机 就 会 失控 。 

除非 计算 机 能 读 到 其 所 有 的 输入 传感器 并 在 适当 的 时 间 范 围 内 作出 所 有 要 求 的 校正 ， 否 
则 飞机 在 飞行 中 将 不 会 稳定 。 我 们 称 这 种 情形 为 “时 间 关 键 的 ”(time critical) 。 换 句 话 说， 
除非 能 在 限定 的 时 间 内 响应 ， 否 则 系统 将 失效 。 

现在 ， 让 我 们 换 一 下 雇主 。 这 次 你 正在 为 彩色 照片 打印 机 设计 一 些 软件 。 市 场 部 门 已 经 写 
出 了 需求 文档 ， 规 定 了 每 分 钟 4 页 的 输出 速率 。 头 一 个 样机 实际 上 每 分 钟 输出 了 3.5 页 ， 这 个 打 
印 机 能 工作 ， 没 有 人 受到 损害 ， 但 它 仍 未 满足 设计 规范 。 这 是 一 个 时 间 敏 感 的 (time sensitive) 
例子 。 系 统 能 工作 ， 但 没有 达到 要 求 。 大 多 数 有 实时 性 能 要 求 的 嵌入 式 应 用 都 包括 在 这 两 类 中 。 

问题 还 有 待 回 答 ,“ 什 么 样 的 测试 基准 与 借入 式 系 统 是 相关 的 ? ”我 们 可 以 采用 SPEC 测 
试 基准 集 ， 但 它们 与 我 们 关心 的 应 用 领域 相关 吗 ? 换 旬 话说,“ 一 个 做 素数 计算 的 测试 基准 对 [40 相 
于 比较 三 个 风 入 式 处 理 器 在 火炉 控制 系统 中 的 潜在 效用 方面 有 多 大 意义 昵 ?”。 
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在 很 长 一 段 时 期 都 设 有 适 于 和 代 入 式 系 统 界 使 用 的 测试 基准 。 可 得 到 的 测试 基准 多 是 可 买 
卖 的 ， 而 不 是 有 用 的 技术 评估 工具 。 其 中 最 声名 狼藉 的 是 MIPS 测 试 基准 。MIPS 测 试 基 准 的 意 
思 是 每 秒 百 万 条 指令 数 (millions of instructions per second) 。 然 而 ， 它 变 成 了 下 面 的 意思 ; 

对 销售 员 来 说 它 是 无 意义 的 性 能 指示 器 。 

MIPS 测 试 基 准 实际 上 是 将 你 的 CPU 性 能 与 一 台 VAX 11/780 计 算 机 的 性 能 相 比 较 的 一 个 相 
对 度量 。11/780 是 一 个 1MIPS 的 机 器 ， 可 在 1 秒 内 执行 1757 次 Dhrystone5 测 试 基准 的 循环 。 因 
此 ， 如 果 你 的 计算 机 能 执行 2400 次 这 个 测试 基准 的 循环 ， 那 么 它 就 是 2400/1757=1.36MIPS 的 
机 器 。Dhrystone 视 试 基准 是 一 个 小 的 C、Pascal 或 Java 程 序 ， 能 编译 成 大 约 2000 行 的 汇编 代码 。 
它 是 被 设计 用 来 测试 处 理 器 整数 性 能 的 ， 它 不 使 用 任何 操作 系统 服务 。 - 

除了 人 们 用 Dhrystone 测 试 基准 做 了 会 产生 经 济 影响 的 技术 决策 以 外 ，Dhrystone 测 试 基准 
本 身 并 没有 什么 错 。 例 如 ， 如 果 因 为 处 理 器 A 在 Dhrystone 测 试 基准 上 得 到 了 更 好 的 结果 ， 我 
们 就 选择 处 理 器 A 而 不 是 B 的 话 ， 就 会 导致 客户 在 他 们 的 设计 中 使 用 很 多 个 A 型 的 处 理 器 。 你 
如 何 能 使 你 的 处 理 器 在 Dhrystone 测 试 基准 上 看 起 来 确实 很 好 呢 ? 由 于 该 测试 基准 是 用 一 种 高 
级 语言 写 的 ， 编 译 器 开发 者 可 针对 Dhrystone 测 试 基准 做 特殊 的 优化 。 当 然 ， 编 译 器 卖家 决 不 
会 做 这 样 的 事 ， 但 是 每 个 人 都 指责 其 他 人 走 类 似 的 捷径 。 根 据 Mann 和 Cobb 所 说 5; 

不 幸 的 是 ， 所 有 常用 于 处 理 器 评估 的 测试 基准 程序 都 相对 较 小 且 指 令 有 高 的 
cache 命 中 率 。 像 Dhrystone 这 样 的 程序 就 有 这 个 特点 。 而 且 它 们 没有 展示 出 很 多 真实 
应 用 中 具有 代表 性 的 大 量 数 据 移动 行为 。 

Mann 和 Cobb 引 用 了 下 面 的 例子 ， 

假设 你 在 一 个 处 理 器 上 运行 Dhrystone 并 发 现 LP ( 微 处 理 器 ) 在 P 周 期 内 执行 了 
某 些 次 选 代 ， 且 cache 命 中 率 接 近 100%。 现 在 ， 假 设 你 从 你 的 应 用 固件 中 选取 了 一 个 
类 似 长 度 的 代码 序列 并 在 相同 UP 上 运行 这 段 代 码 。 你 可 能 期 望 着 该 段 代 码 能 运行 类 

” 似 长 的 时 间 ， 

让 你 温 痕 的 是 ， 你 发 现 这 次 cache 命 中 率 变 成 了 只 有 80%。 在 目标 系统 中 ， 每 一 
次 的 未 命中 都 要 付出 11 个 处 理 器 周期 的 代价 ， 这 期 间 系统 要 等 待 cache 从 慢 束 的 存储 
器 中 再 填 满 ; 11 个 周期 对 于 50MHz 的 CPU 来 说 只 是 220ns。 但 执行 时 间 却 从 Dhrystone 
的 P 周 期 增加 到 了 (0.8 xP) + (0.2xPx1l)=3P。 换 句 话 说 ， 如 果 你 的 预测 完全 是 基 
于 Dhrystone 的 结果 ， 则 cache 命 中 率 下 跌 到 80 允 就 将 使 总 体 性 能 齐 减 到 只 有 期 望 水 平 
的 33%。 

为 了 集中 力量 研究 嵌入 式 产 业 的 测试 基准 问题 ， 蕊 片 供应 商 和 工具 提供 商 在 1997 年 组 成 
了 一 个 团体 ， 由 EDN 杂 志 的 技术 编辑 Marcus Levy 领 导 。 该 团体 的 目标 是 寻求 创建 对 谋 入 式 系 

统 中 硬件 和 软件 "有 意义 的 性 能 测试 基准 。EDN 嵌 入 式微 处 理 器 测试 基准 协会 EEMBC, 读 作 
“Embassy”) 采用 了 来 自 各 种 产业 领域 的 真实 的 测试 基准 。 

所 代表 的 领域 有 : 

。 汽 车 /工业 

。 消费 者 

。 Java 

。 网络 

。 办公 自动 化 

。 远程 通信 

。8 位 和 16 位 微 控制 器 


例如 ， 在 远程 通信 组 有 5 个 类 别 的 测试 ， 在 每 个 类 别 内 有 若干 不 同 的 测试 。 这 些 类 别 是 : 

。 自 相 关 

。 着 积 编码 器 

。 定点 位 分 配 

。 定点 复数 FFT 

。Viterbi GSM 解 码 器 

如 果 这 些 对 你 来 说 有 点 上 星 涩 难 懂 ， 它 们 多 数 确 实 是 这 样 的 。 这 些 算 法 深 深 地 扎根 于 远程 
通信 产业 的 技术 中 。 让 我 们 看 一 个 例子 ， 这 是 在 一 台 750MHz 德 州 仪 器 TMS320C4X 数 字 信 号 
处 理 器 (DSP) 芯片 上 运行 EEMBC 自 相关 测试 基准 的 结果 。 该 结果 显示 于 图 15-3 中 。 

这 个 柱 形 图 显示 出 的 测试 基准 采 
用 了 没有 开启 优化 的 C 编 译 器 ， 进 行 
了 有 进取 性 的 编译 ， 手 工 对 汇编 语言 
进行 了 精细 调整 。 这 个 结果 给 人 以 深 
刻印 象 。 如 果 把 已 经 优化 了 的 C 代 码 
用 汇编 语言 进一步 地 手工 优化 ， 那 么 
测试 基准 的 结果 几乎 会 有 100% 的 提 
高 。 而 且 ， 这 两 个 优化 后 的 测试 基准 直接 使 用 的 C 优 化 后 的 汇编 语言 优化 后 的 
的 结果 要 比 没有 优化 的 结果 分 别 好 ”图 15.3 远程 通信 组 自 相关 测试 基准 中 EEMBC 测 试 基准 的 结果 
19.5% 和 32.2%。 

让 我 们 再 细致 地 考察 一 下 这 个 问题 。 在 所 有 其 他 情况 都 相同 的 情况 下， 我们 将 需要 把 无 优化 结 
果 的 时 钟 速度 从 750MHz 提 高 到 24GHz， 才 能 达到 与 手工 调整 的 汇编 语言 程序 测试 基准 相同 的 性 能 。 

虽然 EEMBC 测 试 基准 是 重大 的 进步 , 但 仍 有 一 些 因素 致使 比较 结果 变 得 相当 无 意义 。 例 如， 
我 们 刚 看 到 编译 器 优化 对 测试 基准 结果 的 有 影响。 除非 用 可 比较 的 编译 器 并 对 测试 基准 施加 优化 ， 
否则 结果 可 能 就 是 被 牌 曲 的 、 错 误解 释 的 。 

另 一 个 相当 独特 的 戏 入 式 系 统 问 题 是 热 
板 (hot board) 问题 。 制 造 商 建 造 了 ， 承 载 
着 处 理 器 的 评估 板 (evaluation board) ， 使 得 
还 没有 得 到 硬件 的 戏 入 式 系统 设计 者 可 在 该 
处 理 器 上 运行 测试 基准 代码 或 其 他 程序 。 评 
估 板 的 定价 经 常 是 高 于 嗜好 者 所 愿意 花费 的 
价钱 ， 但 低 于 总 经 理 可 直接 同意 购买 的 价钱 。 
从 一 个 忆 片 制造 商 的 角度 ， 我 知道 如 果 我 的 
必 片 被 选用 于 客户 的 新 产品 ， 则 评估 板 就 代 
表 一 个 潜在 的 滚滚 流 来 的 收入 。 因 此 ， 我 将 
使 评估 板 的 性 能 特性 最 优化 ， 使 得 测试 基准 
的 结果 尽量 好 。 这 样 的 板 称 为 热 板 ， 它 们 通 
常 不 代表 真实 硬件 的 性 能 特性 。 图 15-4 就 是 
AMD AM186EM 微 控制 器 的 一 个 评估 板 。 毫 
不 奇怪 ， 它 的 价格 是 186 美 元 。 

评估 板 包 含 可 得 到 的 最 快 型 号 的 处 理 器 
(40MHz) ， 而 且 RAM 存 储 器 足够 快 ， 无 需 任 ”图 15-4 来 自 AMD 的 AM186EM-40 微 控制 器 的 评估 板 
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何 额外 的 等 待 状态 就 跟 得 上 处 理 器 的 速度 。 使 用 该 板 所 需要 的 就 是 加 一 个 5V 的 直流 供电 电源 
和 一 根据 到 PC 品行 通讯 端口 的 RS232 电 缆 。 与 评估 板 一 起 提供 的 还 有 一 个 存储 在 ROM 中 的 板 
上 监视 程序 ， 用 于 在 加 电 时 启动 一 个 通信 会 话 。 所 有 的 一 切 都 是 很 方便 的 ， 但 你 必须 确信 这 
反映 了 你 的 目标 硬件 的 实际 操作 状况 。 

另 一 个 要 考虑 的 重要 因素 是 你 的 应 用 是 否 要 运行 在 一 个 操作 系统 上 。 操 作 系统 本 身 引 入 
了 额外 的 开销 ， 有 可 能 会 降低 性 能 ， 而 且 ， 如 果 你 的 应 用 是 一 个 低 优先 级 的 任务 ， 它 就 有 可 
能 由 于 高 优先 级 任务 不 断 地 进行 而 中 断 ， 从 而 因 得 不 到 CPU 周 期 而 饿 死 。 

一 般 来 说 ， 所 有 的 测试 基准 都 是 相对 于 某 个 时 间 线 来 度量 的 。 我 们 或 者 度量 一 个 测试 基 
准 运行 所 需 的 时 间 量 ， 或 者 度量 一 个 测试 基准 在 单位 时 间 (如 1 小 时 、1 分 钟 、1 秒 钟 或 1 秒 钟 
的 若干 分 之 几 ) 所 能 重复 运行 的 次 数 。 有 时 ， 我 们 可 简单 地 对 运行 足够 长 的 事件 计时 ， 我 们 
可 以 用 一 个 秒表 来 度量 两 次 向 控制 台 写 入 的 时 间 间 隔 。 你 可 以 通过 在 代码 中 插入 printf( ) 或 
cout 语 句 轻松 地 做 到 这 一 点 。 但 是 ， 如 果 你 要 计时 的 事件 只 运行 几 毫 秒 或 几 微 秒 该 怎么 度量 
呢 ? 如果 你 能 得 到 操作 系统 的 服务 ， 你 就 能 用 更 高 的 时 间 分 辩 率 来 记录 进入 点 和 退出 点 。 然 
而 ， 每 一 次 对 O/S 服 务 或 库 程 序 的 调用 都 会 
对 你 试图 要 度量 的 系统 有 潜在 的 巨大 干扰 ， 
这 有 点 像 海 森 堡 的 测 不 准 原理 。 

在 有 些 例子 中 ,评估 板 可 能 包含 IO 端 
口 ， 你 可 以 对 其 开关 。 用 一 台 示 波 器 或 其 他 
某 个 高 速 数据 记录 仪 ， 你 可 以 直接 对 某 事件 
或 多 个 事件 进行 计时 ， 并 且 对 系统 产生 最 小 
干扰 。 图 15-5 显 示 出 用 示波器 对 一 个 函数 的 
进入 点 和 退出 点 进行 记录 而 作出 的 软件 时 序 
度量 。 参 考 此 图 你 会 看 到 ， 当 有 函数 进入 时 ， 
IO 引 脚 就 会 被 打开 ， 然 后 关闭 ， 产 生 一 个 短 
脉冲 。 在 退出 时 ， 再 生成 一 个 脉冲 。 这 两 个 
脉冲 的 时 间 差 就 是 函数 执行 时 间 的 度量 。 两 
条 垂直 的 虚线 是 指示 标 ， 可 放置 于 波形 上 以 
确定 时 序 参考 标记 。 在 本 例 中 ， 两 个 指示 标 
之 间 的 时 间 差 是 3.640ms。 

另 一 种 方法 是 采用 数字 硬件 设计 者 选择 的 
工具 ， 即 逻辑 分 析 仪 。 图 15-6 就 是 由 Tektronix 
公司 生产 的 TLA7151 逻 辑 分 析 仪 的 照片 。 在 照 
片 中 ， 逻辑 分 析 仪 有 多 股 线 通 过 专用 电缆 连接 
到 计算 机 板 的 总 线 。 在 板 上 提供 专用 端口 使 得 
逻辑 分 析 仪 可 以 很 容易 地 连接 到 板 上 ， 这 是 电 
路 板 设计 者 的 共同 经 验 和 良好 思想 。 逻 辑 分 析 
仪 使 设计 者 能 在 同一 时 间 记 录 很 多 数字 位 的 状 
态 。 想 像 一 下 ， 你 能 对 80 个 数字 位 宽 的 数字 系 
统 的 数据 和 时 间 同 时 记录 1 百 万 个 采样 。 你 可 图 15-6 Tektronix TLA7151 逻 辑 分 析 仪 的 照 请 。 
能 将 32 位 用 于 数据 ，32 位 用 于 地 址 总 线 ， 其 余 用 逻辑 分 析 仪 的 电费 探测 计算 机 板 上 的 
的 16 位 用 于 各 种 状态 信和 号。 而且， 逻辑 分 析 仪 总 线 信号 。 照 片 由 Tektronix 公 司 提供 





图 15-5 采用 示波器 测量 函数 进入 点 和 退出 点 之 间 的 
时 间 差 ， 从 而 对 软件 性 能 进行 度量 





计算 机 体 夭 结构 扒 性 能 问题 
中 的 电路 可 被 编程 为 只 记录 特定 的 位 模式 。 例 如 ， 假 设 我 们 将 逻辑 分 析 仪 编程 为 只 记录 向 存储 
器 地 址 0xAABB0000 中 写 入 的 数据 。 逻 辑 分 析 仪 将 监视 所 有 的 位 ， 但 只 有 在 地 址 与 0xAABB00 匹 
配 时 且 状 态 位 指示 数据 写 在 进行 时 ， 才 记录 数据 线 上 的 32 位 数据 。 此 外 ， 每 次 逻辑 分 析 仪 记录 
数据 写 事件 时 ， 都 会 给 事件 加 上 时 间 印 记 ， 并 将 时 间 和 数据 一 起 记录 下 来 。 

我 们 在 这 个 例子 中 要 考虑 的 最 后 一 个 要 素 是 在 代码 中 插入 适当 的 参考 单元 ， 使 得 当 它们 
发 生 时 逻辑 分 析 仪 能 检测 并 记录 它们 。 例 如 ， 假 如 我 们 要 用 位 模式 0xAAAAXXXX 作 为 一 个 
函数 的 进入 点 ，0x5555XXXX 作 为 退出 点 。“X” 的 意思 是 “无 关 ”， 它 可 以 是 任意 值 ， 然 而 ， 
我 们 可 利用 它们 为 程序 中 的 每 个 函数 赋予 唯一 的 标志 符 。 

让 我 们 看 一 个 程序 中 的 典型 函数 。 下 面 就 是 这 个 函数 : 


int typFunct(int aVar, int bVar， int CVar) 


a /*Lines of code*/ 
SS /*Lines of code*/ 


现在 ,让 我 们 加 上 我 们 的 度量 “标签 ”。 我们 称 这 个 过 程 为 对 代码 加 检测 (instrumenting ) 。 
下 面 就 是 加 检测 后 的 函数 : 
int typFunct(int aVar, int bvVar, int cVar) 


于 
* (Volatile unsigned int*)O0xAABB0000=0xAAAA03E7 
i /*Lines of code*/ 


A A intx )0xRARARBB0000=0X555503BE7 

} 

这 个 相当 难 解 的 C 语 句 *(volatile unsigned int*) 0xAABB0000 = 0xAAAA03E7 产 生 
了 一 个 指向 地 址 90xAABB0000 的 指针 ， 并 立即 将 值 0xXAAAA03E7 写 入 了 这 个 存储 器 位 置 。 
我 们 可 以 假设 0x03E7 就 是 我 们 分 配给 函数 typFunct( ) 的 代码 。 这 个 语句 就 是 我 们 的 标签 
生成 器 ， 它 生成 数据 写 动作 ， 主 计算 机 





部 分 跟踪 列表 
然后 逻辑 分 析 仪 就 能 对 其 进行 地 址 ， 数据 时 间 (ms) 
捕获 和 记录 。 关键 字 volatile 告 aq sonota 


5555045A 151.34451 
AAAAC4OF 
S5555C40F 


诉 编译 器 这 个 写 操作 不 用 进行 
缓存 。 图 15-7 就 是 这 个 过 程 的 示 
意图 。 我 们 将 图 15-7 的 数据 总 结 
在 一 个 表 中 。 

查看 该 表 ， 注 意 标记 为 045A 
的 函数 为 什么 分 别 有 两 个 不 同 的 
执行 时 间 0.27819 和 8.33411。 这 
看 起 来 可 能 有 点 奇怪 ， 但 实际 上 
很 平常 。 例 如 ， 一 个 递归 函数 可 
能 有 不 同 的 调用 数学 库 程序 的 函 。 图 15-7 通过 采用 逻辑 分 析 仪 记录 进入 点 和 退出 点 对 软件 性 能 作 
数 ， 也 就 有 不 同 的 执行 时 间 。 然 出 度量 
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而 ， 这 可 能 也 预示 着 这 个 函数 会 被 中 断 ， 所 以 其 运行 时 间 就 可 能 要 取决 于 系统 的 当前 状态 和 
VO 活动 而 大 幅度 地 变化 。 

这 里 的 关键 问题 是 你 几乎 可 以 将 度量 做 得 任意 地 谨慎 。 对 无 cache 存 储 器 的 单个 写 操 作 所 
产生 的 开销 应 该 不 会 对 度量 产生 过 大 的 扭曲 。 而 且 ， 还 要 注意 逻辑 分 析 仪 是 连接 到 另 一 个 主 
计算 机 上 的 。 假 如 这 个 主 计算 机 是 用 于 做 初始 源 代 码 测 试 的 ， 它 就 应 该 对 符号 表 和 链接 映像 
有 所 访问 。 因 此 ， 它 就 能 通过 实际 地 提供 函数 名 而 不 是 标识 符 码 来 提交 结果 。 

这 样 ， 只 要 待 测 系统 运行 足够 长 的 时 间 间 隔 ， 我 们 就 能 像 图 15-7 所 显示 的 那样 持续 地 收 
集 数 据 ， 然 后 做 一 些 简 单 的 统计 分 析 来 为 这 些 函 数 确定 最 小 平均 执行 时 间 、 最 大 平均 执行 时 
间 及 平均 执行 时 间 。 

这 种 类 型 的 度量 还 能 使 我 们 获得 什么 其 他 类 型 的 性 能 数据 呢 ? 一 些 度量 总 结 如 下 : 

1. 实时 跟踪 : 当 程 序 实 时 运行 时 ， 记 录 函 数 的 进入 点 和 退出 点 就 能 提供 程序 执行 路 径 的 
历史 信息 。 这 种 调试 技术 不 停止 程序 的 执行 流程 ， 它 不 是 单 步 运 行 的 ， 也 不 是 运行 到 断 点 就 
停止 的 。 

2. 覆盖 测试 : 该 测试 保留 程序 运行 部 分 和 未 运行 部 分 的 踪迹 。 这 对 于 定位 死 代 码 和 执行 
附加 有 效 性 测试 都 是 有 价值 的 。 

3. 存储 器 泄漏 : 在 存储 器 动态 分 配 和 释放 的 每 个 位 置 上 放置 标识 ， 就 可 以 确定 系统 是 否 
存在 存储 器 泄漏 或 碎片 问题 。 

4. 分 支 分 析 : 通过 对 程序 分 支 加 入 测试 ， 就 能 确定 代码 中 是 否 存在 不 可 跟踪 的 或 没有 彻 
底 测 试 的 路 径 。 对 于 任何 被 认为 是 有 关键 使 命 的 (mission critical) 并 且 在 应 用 到 实际 产品 前 
必须 由 政府 管理 机 构 鉴定 的 代码 ， 这 个 测试 是 必需 的 。 


函数 进入 点 /退出 点 (msec) 时 间 差 
03E7 145.87503/151.00048 5.12545 
045A 151.06632/151.34451 0.27819 
C40F 151.90018/155.63294 3.73276 
00A4 155.66001/157.90087 2.24086 
2B33 158.00114/160.62229 | 2.62115 
045A 160.70003/169.03414 8.33411 





虽然 逻辑 分 析 仪 提供 了 一 个 侵扰 性 很 低 的 测试 环境 ， 但 并 不 是 所 有 的 计算 机 系统 都 能 以 
这 种 方式 来 进行 度量 。 就 像 前 面 所 讨论 过 的 ， 如 果 有 操作 系统 ， 则 标识 的 生成 过 程 和 记录 可 
作为 另 一 个 操作 系统 任务 来 完成 。 当 然 ， 这 显然 更 有 侵扰 性 ， 但 对 某 些 情 况 也 许 是 一 个 合理 
的 解决 方法 。 

到 此 你 也 许 忍 不 住 建 议 :“ 为 什么 为 标识 烦恼 呢 ? 如 果 多 辑 分 析 仪 能 记录 发 生 在 系统 总 线 
上 的 任何 事情 ， 只 要 记录 所 有 事情 不 就 行 了 吗 ? ”这 是 一 个 好 的 观点 ， 但 它 只 能 在 无 cache 的 
处 理 器 上 工作 良好 。 然 而 ， 只 要 你 有 一 个 具有 片 cache 的 处 理 器 ， 总 线 活动 就 不 再 是 处 理 器 
活动 的 指示 器 。 这 就 是 为 什么 标识 工作 得 如 此 好 的 原因 。 

虽然 逻辑 分 析 仪 对 于 这 些 种 度量 而 言 工作 得 相当 好 ， 但 也 有 其 局 限 性 ， 因 为 必须 要 停 
止 收集 数据 并 成 批 地 上 传 跟踪 存储 器 的 内 容 。 这 意味 着 像 中 断 服务 例 程 这 样 的 低 占 空 因数 
的 事件 可 能 未 被 捕获 。Metrowerks 有 像 CodeTest 这 样 的 商业 产品 ， 它 能 在 不 停止 的 情况 下 ， 


通过 不 断 地 对 标识 进行 收集 、 压 缩 、 并 发 送 到 主 计 算 机 来 解决 这 个 问题 。 图 15-8 就 是 
CodeTest 系 统 的 图 片 ， 图 15-9 显 示 的 是 性 能 度量 的 数据 。 





1077 


Ss 


人 





六 他 


图 15-8 针对 实时 系统 的 CodeTest 软 件 系统 性 ”图 15-9 CodeTest 的 屏幕 照片 显示 出 了 软件 性 能 度量 。 当 目 
能 分 析 仪 。 图 片 来 自 Metrowerks 公 司 标 系统 实时 运行 时 ， 数 据 是 连续 更 新 的 。 照 片 来 自 
Metrowerks 公 司 
性 能 设计 

学 软件 的 学 生 应 该 学 习 计 算 机 体系 结构 的 最 重要 原因 是 为 了 理解 他 们 的 软件 所 要 运行 于 
其 中 的 机 器 和 环境 的 强项 和 局 限 性 。 没 有 对 机 器 在 操作 上 的 特性 的 一 个 理性 的 洞察 ， 就 很 容 
易 写 出 低 效率 的 代码 。 更 坏 的 是 ， 很 容易 将 低 效 率 的 代码 误 认为 是 由 硬件 平台 本 身 的 局 限 性 
造成 的 。 这 可 能 导致 对 硬件 进行 重新 设计 的 决策 ， 以 使 系统 性 能 提高 到 期 望 的 水 平 ， 虽 然 简 
单 地 重 写 一 些 关键 函数 就 可 能 解决 问题 。 

下 面 的 故事 是 一 个 实际 事件 ， 可 用 来 阐明 这 一 点 : 

很 久 以 前 ， 在 很 远 的 地 方 ， 我 是 CodeTest 产 品 研 发 的 主管 。 一 个 主要 的 远程 通信 和 制造 商 正 
考虑 买 一 大 批 CedeTest 的 设备 ， 所 以 我 们 从 工厂 派出 一 个 队伍 来 演示 产品 。 客 户 打算 要 对 其 出 
售 的 一 种 主要 的 远程 交换 系统 进行 重新 设计 ， 因 为 他 们 认为 该 系统 已 经 达到 了 硬件 性 能 的 极限 。 

我 们 的 队伍 到 达 他 们 那里 后 ， 在 他 们 的 硬件 中 安装 了 一 个 CodeTest 部 件 。 在 对 他 们 的 交 
换 器 测试 了 若干 个 小 时 后 ,我 们 一 起 检查 数据 。 在 我 们 考察 的 几 百 个 函数 中 ， 没 有 一 个 工程 
师 能 识别 出 那个 耗费 了 15%CPU 时 间 的 函数 。 在 对 源 代码 进行 钻研 后 ， 工 程 师 们 发 现 了 一 个 
由 实习 学 生 加 入 的 调试 程序 。 这 个 实习 生 将 调试 该 系统 的 一 部 分 作为 他 夏季 的 项 目 。 为 了 跟 
踪 程 序 流程 ， 他 编制 了 一 个 高 优先 级 的 函数 ， 使 交换 器 的 一 个 电路 板 的 灯 闪 光 。 作 为 一 个 实 
习 生 ， 他 绝 不 会 担心 能 否 正确 地 识别 出 这 个 函数 是 一 个 临时 调试 函数 ， 而 且 不 知 何故 这 个 函 
数 就 被 包装 进 了 发 行 的 产品 代码 中 。 

在 消除 函数 和 重新 建立 文件 后 ， 客 户 获 得 了 15% 的 额外 性 能 空间 。 他 们 对 此 结果 非常 兴 
奋 ， 慷 慨 地 酬谢 了 我 们 ， 并 招待 了 我 们 一 顿 丰 盛 的 宣 会 。 不 幸 的 是 ， 他 们 不 再 需要 CodeTest 
仪器 了 ， 我 们 失去 了 这 笔 买 卖 。 这 个 故事 的 寅 意 是 ， 没 有 人 会 去 真正 检查 系统 的 性 能 特性 。 
每 个 人 都 假设 他 们 的 代码 工作 良好 ， 系 统 总 体 运行 在 最 佳 状 态 。 

Stewart "注意 到 实时 软件 开发 者 所 犯 的 首要 错误 是 不 知道 他 们 代码 的 实际 运行 时 间 。 这 
不 仅仅 是 一 个 学 术 问 题 ， 即 使 你 正在 开发 的 软件 是 为 了 运行 于 PC 或 工作 站 ， 你 也 要 考虑 系统 
能 否 获得 最 佳 性 能 的 问题 ， 这 与 任何 其 他 形式 的 工程 问题 是 一 样 的 。 你 应 该 努力 以 最 高 效率 
利用 你 可 以 得 到 的 资源 。 
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性 能 问题 在 具有 有 限 资 源 或 实时 性 能 约束 的 系统 中 最 为 关键 。 一 般 来 说 ， 这 是 大 多 数 出 
入 式 系统 的 研究 领域 ， 所 以 我 们 将 注意 力 集中 在 该 领域 。 

Ganssle'' 不 主张 在 C 或 C++ 中 写 中 断 服务 程序 ， 因 为 其 执行 时 间 是 不 可 预测 的 。 使 代码 执 
行 达到 可 预测 的 唯一 途径 是 用 汇编 语言 写 程序 。 是 这 样 的 吗 ? 如 果 你 采用 一 个 带 有 片上 cache 
的 处 理 器 ， 你 如 何 知道 代码 的 cache 命 中 率 是 多 少 ?中 断 服务 程序 实际 上 的 运行 时 间 要 比 汇编 
语言 周期 数 所 预测 的 时 间 长 得 多 。 

Hillary 和 Berger'* 描 述 了 一 个 能 满足 软件 设计 性 能 目标 的 4 步 过 程 ; 

1: 确立 一 个 性 能 预算 ， 

2. 对 系统 建 模 并 分 配 预算 ， 

3. 测试 系统 模块 ， 

4. 验证 最 终 设计 的 性 能 。 

性 能 预算 可 定义 为 : 

性 能 预算 = 求 和 ( 景 坏 情况 条 件 下 所 需 的 操作 ) 
= [1/( 数 据 过 率 )] 一 操作 系统 开销 一 裕 量 

数据 速率 就 是 数据 被 生成 并 将 被 处 理 的 速率 。 由 此 可 知 ， 你 必须 减 去 操作 系统 的 开销 ， 
而 且 最 终 要 为 因 加 入 额外 特性 而 总 是 要 加 入 的 代码 留 有 余地 。 

对 系统 建 模 意味 着 将 预算 分 解 成 所 需 的 功能 模块 ， 并 为 每 一 个 模块 分 配 时 间 。 大 多 数 工 
程 师 没 有 关于 不 同 功能 所 需 时 间 量 的 线索 ， 所 以 他 们 进行 “推测 ”"。 实 际 上 ， 这 没有 那么 坏 ， 
因为 至 少 他 们 在 生成 预算 。 有 很 多 种 方式 来 细 化 这 些 猜 测 而 不 用 实际 地 写 出 最 终 的 代码 并 对 
实际 情况 进行 测试 。 关 键 是 提高 对 可 得 到 时 间 和 所 需 时 间 相 比较 的 意识 。 

一 旦 软件 开发 开始 ， 在 模块 级 测试 执行 时 间 而 不 是 等 到 集成 阶段 再 看 软件 性 能 是 否 满足 
规范 要 求 就 是 有 意义 的 。 这 将 给 你 一 个 关于 代码 对 于 性 能 预算 的 即时 反馈 。 记 住 ， 猜 测 可 能 
有 两 种 情况 ， 太 长 或 太 短 ， 所 以 你 也 可 能 有 比 你 想像 的 更 多 的 时 间 富 余 (虽然 Murphy 定 律 总 
是 保证 这 是 很 小 概率 的 事件 ) 。 

最 后 一 步 是 验证 最 终 设计 。 这 意味 着 要 采用 我 们 已 经 讨论 过 的 一 些 方法 对 系统 性 能 进行 
精确 的 测量 。 拥 有 这 些 数据 将 使 你 能 够 在 软件 需求 文件 上 签字 通过 ， 同 时 也 能 为 以 后 的 项 目 
提供 有 价值 的 数据 。 


15.3 最 佳 习惯 


让 我 们 用 一 些 最 佳 习惯 的 讨论 来 结束 本 章 。 有 几 百 个 最 佳 习 惯 ， 要 全 部 讨论 就 太 多 了 。 
然而 ， 我 们 可 以 对 某 些 性 能 问题 以 及 该 做 哪些 和 不 该 做 哪些 进行 一 番 了 解 。 

1. 在 你 开始 写 代 码 之 前 制作 一 个 需求 文档 和 设计 规范 。 遵 循 一 个 公认 的 软件 开发 过 程 。 
与 大 多 数学 生 所 想 的 相反 ， 编 制 代码 (code hacking) 对 于 一 个 职业 程序 员 并 不 是 令 人 莱 莫 的 
特征 。 如 果 可 能 ， 在 系统 的 体系 结构 设计 决策 完成 前 参与 其 中 。 如 果 没 有 其 他 的 学 习 计 算 机 
体系 结构 的 理由 ， 这 就 是 一 个 。 在 项 目 开始 时 ， 如 果 划 分 决策 不 佳 ， 那 么 通常 会 导致 软件 团 
队 在 项 目 后 期 修补 混乱 方面 产生 压力 。 

2. 采用 好 的 编程 习惯 。 不 管 你 是 为 一 个 PC 编码 ， 还 是 为 一 个 嵌入 式 控制 器 编码 ， 这 条 软 
件 设计 规则 都 同样 适用 。 要 很 好 地 理解 算法 设计 的 一 般 原 理 。 例 如 ， 如 果 数 据 量 很 大 ， 就 不 
要 用 O(n ”) 的 算法 。 无 论 硬件 多 好 ， 低 效 的 算法 都 能 使 最 快 的 处 理 器 停止 。 

3. 学 习 你 要 使 用 的 编译 器 ， 并 了 解 如 何 最 大 程度 地 利用 它 。 大 多 数 工业 质量 的 编译 器 都 
是 极其 复杂 的 程序 ， 通 常 其 文档 让 人 很 难 理解 。 因 此 ， 大 多 数 工程 师 继续 以 他 们 过 去 的 方式 
使 用 编译 器 ， 而 不 关心 通过 探究 可 利用 的 优化 选项 能 获得 什么 样 的 性 能 改进 。 如 果 编 译 器 本 
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身 是 针对 特定 的 CPU 体 系 结构 构建 的 ， 就 更 是 应 该 学 习 它 。 例 如 ， 有 一 个 用 于 Intel i960 处 理 
器 系列 的 GNU13 编 译 器 版 本 ， 能 通过 执行 程序 来 生成 性 能 的 轮廓 数据 ， 并 将 该 数据 用 于 后 续 
的 编译 -执行 循环 中 ， 以 提高 代码 的 性 能 。 

4. 了 解 代码 的 执行 限制 。 例 如 ，Ganssle" 建 议 ， 为 了 确定 为 堆栈 分 配 多 少 存储 器 ， 你 应 该 用 
如 OxAAAA 或 0x5555 这 样 的 可 辨别 的 存储 模式 将 堆栈 区 充满 。 然 后 ， 将 你 的 程序 运行 足够 长 的 时 
间 ， 确 信 它 已 被 彻底 地 使 用 了 。 现 在 就 可 以 通过 观察 位 模式 在 哪里 被 覆盖 来 得 到 堆栈 区 的 高 水 
位 标记 (high water mark) ， 然 后 加 入 一 个 安全 因数 ， 这 就 是 你 的 堆栈 空间 。 当 然 ， 这 暗示 着 你 
的 代码 对 于 堆栈 是 确定 性 的 。 在 高 可 靠 性 软件 设计 中 ， 最 不 该 做 的 事情 之 一 就 是 使 用 递归 函数 。 
递归 函数 每 次 调用 自身 就 生成 一 个 堆栈 帧 ， 这 就 要 继续 建立 堆栈 。 除 非 你 绝对 地 知道 最 坏 情况 
下 的 递归 调用 序列 ， 和 否则 不 要 使 用 递归 。 虽 然 递归 函数 简单 易 用 ， 但 在 严格 限制 了 资源 的 系统 
中 也 是 危险 的 。 而 且 ， 它 们 在 函数 调用 和 返回 代码 中 有 非常 大 的 开销 ， 所 以 性 能 会 受到 影响 。 

5. 当 需 要 绝对 控制 时 使 用 汇编 语言 。 如 果 你 知道 如 何 用 汇编 语言 编程 ， 就 不 要 害怕 钻研 
进去 做 一 些 手工 工作 。 所 有 的 编译 器 都 有 将 汇编 语言 包含 进 你 的 C 或 C++ 程序 的 机 制 。 采 用 能 
满足 所 要 求 的 性 能 目标 的 语言 。 

6. 当 你 为 任何 嵌入 式 系统 或 其 他 有 高 可 靠 性 要 求 的 系统 进行 设计 时 ， 要 十 分 小 心动 态 存 
储 分 配 问 题 。 即 使 在 设计 中 没有 存储 泄漏 问题 ， 比 如 忘记 释放 分 配 的 存储 空间 或 者 坏 指针 错 
误 等 ， 如 果 内 存 处 理 程序 代码 与 你 的 应 用 不 能 很 好 地 匹配 ， 存 储 器 也 可 能 会 碎片 化 。 

7. 不 要 忽视 处 理 器 提供 的 所 有 异常 向 量 。 错 误 处 理 程序 是 重要 的 代码 片段 ， 能 帮助 你 保 
持 系 统 存活 。 如 果 你 不 利用 它们 ， 或 者 仅仅 用 它们 导向 一 般 的 系统 重新 启动 ， 那 么 你 将 永远 
不 能 追踪 到 为 什么 在 每 四 年 的 2 月 29 日 系统 就 崩溃 一 次 。 

8. 确认 你 和 硬件 设计 者 在 低地 址 存放 最 高 有 效 位 还 是 最 低 有 效 位 两 种 模型 的 选择 上 达成 
一 致 。 
9. 明智 地 使 用 全 局 变量 。 即 使 冒 着 招致 计算 机 科学 家 愤怒 的 危险 ， 我 也 不 会 说 :“ 不 要 使 
用 全 局 变量 "， 因 为 全 局 变量 为 传递 参数 提供 了 一 种 非常 高 效 的 机 制 。 然 而 ， 应 该 明白 使 用 全 
局 变量 有 危险 的 副作用 。 例 如 ，Simon's 在 他 对 共享 数据 问题 的 讨论 中 六 明了 像 全 局 变量 这 样 
的 与 存储 缓冲 相关 联 的 问题 。 如 果 一 个 全 局 变量 被 用 于 保存 共享 数据 ， 则 车 一 个 任务 试图 读 
该 数据 同时 另 一 个 任务 正在 写 这 个 数据 ， 就 可 能 会 引起 错误 。 系 统 体系 结构 会 影响 这 种 情况 ， 
因为 全 局 变量 的 大 小 和 外 部 存储 器 的 大 小 可 能 在 一 个 系统 中 产生 问题 但 在 另 一 个 系统 中 就 不 
是 问题 。 例 如 ， 假 设 一 个 32 位 值 正 被 用 作 全 局 变量 ， 如 果 存储 器 是 32 位 宽 ， 则 只 需要 一 次 存 
储 器 写 来 改变 变量 的 值 ， 所 以 两 个 任务 可 同时 访问 这 个 变量 而 不 会 产生 问题 。 但 是 ， 如 果 存 
储 器 是 16 位 宽 ， 则 需要 两 次 连续 的 数据 写 来 更 新 变量 。 如 果 在 第 一 次 存储 器 访问 之 后 第 二 次 
访问 之 前 ， 第 二 个 任务 中 断 了 第 一 个 任务 ， 那 么 就 会 读 到 毁坏 的 数据 。 

10. 采用 合适 的 工具 进行 工作 。 大 多 数 软件 开发 者 都 不 愿意 在 没有 一 个 好 的 调试 器 的 情况 
下 调试 程序 。 不 要 仅仅 因为 示波器 或 逻辑 分 析 仪 是 “硬件 设计 者 的 工具 ”就 害怕 使 用 它们 。 
总 结 


fs 一 口 


本 章 包 含 如 下 内 容 : 

， 各 种 硬件 因素 和 软件 因素 会 如 何 影响 一 个 计算 机 系统 的 实际 性 能 。 
。 人 性 能 如 何 度量 。 

。 为 什么 性 能 并 不 总 是 意味 着 “尽量 快 ”。 

“用 于 满足 性 能 要 求 的 方法 。 
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习题 


1. 热 衷 于 在 他 们 的 PC 上 玩 视频 游戏 的 人 经 常 加 入 液体 冷却 系统 来 排除 来 自 CPU 的 热量 。 为 什么 ? 

2. 为 什么 在 你 的 PC 上 加 入 更 多 存储 器 常常 比 用 更 快 的 CPU 代替 当前 的 CPU 对 性 能 有 更 大 的 影响 ? 

3. 假设 你 正在 试图 比较 两 个 计算 机 的 相对 性 能 。 计 算 机 1 具有 100MHz 的 时 钟 频率 ， 计 算 机 2 具 
有 250MHz 的 时 钟 频 率 。 计 算 机 1 执行 其 指令 集中 的 所 有 指令 都 用 1 个 时 钟 周期 。 平 均 而 言 ， 
计算 机 2 执行 其 指令 集中 的 40% 的 指令 要 用 一 个 时 钟 周期 指令 集 其 余 的 指令 要 用 两 个 时 钟 
周期 。 那 么 ， 运 行 一 个 包含 先是 1000 条 连续 指令 ， 接 着 100 条 指令 的 200 次 循环 的 测试 程序 ， 
每 个 计算 机 各 要 运行 多 长 时 间 。 

注释 : 你 可 以 假设 ， 对 于 计算 机 2， 测 试 程序 中 的 指令 是 以 如 上 所 述 的 匹配 计算 机 总 体 

性 能 的 方式 而 随机 分 布 的 。 

4. 对 于 给 定 的 指令 集体 系 结构 ， 讨 论 可 提高 处 理 器 性 能 的 三 种 方式 。 

5. 假设 计算 机 1 平均 每 条 指令 需要 2.0 个 时 钟 ， 时 钟 频率 为 1GHz。 计 算 机 2 平均 每 条 指令 需要 1.2 
个 时 钟 ， 时 钟 频率 为 500MHz。 哪 一 个 计算 机 有 相对 更 好 的 性 能 ?将 你 的 答案 表达 成 百分比 。 

6. 假 设 你 正在 努力 评估 两 个 不 同 的 编译 器 。 为 此 你 采用 了 某 个 标准 测试 基准 ， 并 用 每 种 编译 
器 分 别 将 其 编译 成 汇编 语言 。 这 个 特定 处 理 器 的 指令 集体 系 结构 是 这 样 的 ， 根 据 每 条 指令 
执行 所 需要 CPU 时 钟 周期 数 ， 汇 编 语言 指令 可 分 为 4 类 ， 如 下 表 所 示 : 











指令 类 别 执行 时 所 需 CPU 有 周期 数 
A 类 2 
B 类 3 
C 类 4 
D 类 6 





观察 每 个 编译 器 的 汇编 语言 输出 ， 确 定编 译 器 产生 的 每 类 指令 的 相对 分 布 。 
编译 器 A 将 程序 编译 成 1000 条 汇编 语言 指令 ， 并 产生 如 下 所 示 的 指令 分 布 : 
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指令 类 别 每 类 指令 所 占 百分比 (%) 


A 类 40 
B 类 10 
C 类 30 
D 类 20 


编译 器 B 将 程序 编译 成 1200 条 汇编 语言 指令 ， 并 产生 如 下 所 示 的 指令 分 布 : 


指令 类 别 每 类 指令 所 占 百 分 比 (%) 
A 类 60 
B 类 20 
C 类 10 
D 类 10 


对 于 这 个 测试 程序 ， 你 预期 哪个 编译 器 会 给 出 更 好 的 性 能 ?为 什么 ?请 尽量 详 述 。 
7. 假 设 你 正在 考虑 对 某 个 产品 进行 设计 权衡 ， 该 产品 对 成 本 极端 敏感 。 为 了 降低 硬件 成 本 ， 
你 考虑 使 用 一 款 具有 8 位 宽 外 部 数据 总 线 的 处 理 器 而 不 采用 另 一 款 具 有 16 位 宽 数据 总 线 的 处 
理 器 。 两 款 处 理 器 以 相同 的 时 钟 频率 运行 ， 其 内 部 都 是 完全 的 32 位 宽 。 如 果 你 打算 将 两 个 
32 位 宽 的 存储 器 中 的 变量 相 加 ， 并 将 和 也 存 到 存储 器 中 ， 你 预期 会 看 到 什么 样 的 性 能 差异 。 
8. 为 什么 编译 器 会 通过 最 大 化 代码 中 基本 模块 的 大 小 和 数量 来 优化 程序 ? 回顾 可 知 ， 基 本 模 
块 就 是 一 个 代码 片段 ， 具 有 一 个 入 口 、 一 个 出 口 ， 且 没有 内 部 循环 。 








第 16 章 未 来 发 展 趋势 与 可 重 构 硬件 


学 习 目 标 

。 可 编程 逻辑 如 何 实 现 ， 
。ABEL 编 程 语言 的 基本 要 素 ， 

。 什 么 是 可 重 构 硬件 ， 如 何 实 现 ， 

。 现 场 可 编程 门 阵列 的 基本 体系 结构 ; 
。 可 重 构 计算 机 器 的 体系 结构 ， 

。 分 子 计算 的 一 些 未 来 发 展 趋势 ， 

。 无 时 钟 计算 的 未 来 发 展 趋势 。 


16.1 引言 


从 第 1 章 开 始 到 现在 我 们 已 经 走 了 很 长 的 路 ， 本 章 将 结束 本 书 并 展望 未 来 发 展 方向 。 这 并 
不 是 说 我 们 将 跳 到 明星 企业 正在 使 用 的 计算 机 (虽然 这 样 做 会 是 一 件 令 人 高 兴 的 事情 )， 而 是 
看 看 目前 发 展 趋势 会 将 我 们 引 向 哪里 。 沿 此 方向 ， 我 们 将 着 眼 于 一 个 主题 ， 该 主题 正 变 得 越 
来 越 重 要 ， 但 我 们 至 今 还 没有 在 一 个 适宜 的 地 方 讨论 它 。 

本 课本 的 关注 点 一 直 是 以 软件 开发 者 的 角度 来 看 待 硬件 。 一 个 在 若干 年 来 已 经 发 生 并 在 
增长 的 趋势 是 : 硬件 和 软件 之 间 的 边界 变 得 模糊 了 。 无 疑 ， 软 件 是 硬件 状态 机 的 驱动 代码 。 
但 是 ， 如 果 硬 件 本 身 就 像 软件 算法 一 样 可 编程 的 话 将 会 怎样 ? 你 能 想像 一 台 在 加 载 软件 之 前 
没有 任何 个 性 的 计算 机 吗 ? 换 名 话说，68K、x86 或 ARM 之 间 不 存在 任何 区 别 ， 直 至 你 加 载 一 
个 新 的 软件 。 程 序 的 一 部 分 实际 上 是 用 于 将 硬件 配置 成 期 望 的 体系 结构 。 你 说 这 是 科幻 小 说 
吗 ? 不 全 是 。 继 续 读 下 去 吧 。 


16.2 可 重 构 硬 件 


从 历史 的 视角 来 看 ， 可 配置 硬 ， 
件 开 始 于 20 世 纪 70 年 代 的 数字 集成 ! 
电路 PAL， 即 可 编程 阵列 逻辑 | 、、 
(programmable array logic) 。PAL 1 


包含 一 组 通用 门 和 触发 器 ， 它 们 将 ~、 
以 某 种 方式 组 织 在 一 起 ， 使 得 设计 DS > | > 
者 能 轻松 地 创建 从 简单 到 中 等 复杂 
的 积 和 逻辑 电路 或 状态 机 。 2 

图 16-1 所 示 的 门 是 一 个 非 反 相 
缓冲 门 。 一 个 不 提供 逻辑 功能 的 门 
可 能 看 起 来 有 点 奇怪 ， 但 有 时 纯粹 
的 逻辑 应 当 遵从 于 数字 电路 电子 特 
性 的 现实 ， 这 样 我 们 就 需要 电路 在 。 “图 16-1 非 反 相 缓冲 门 的 简化 示意 图 ， 具 有 开 集 电极 输出 构造 


、 
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输入 到 输出 间 存 在 非 反 相 有 逻辑 。 在 这 个 特定 的 例子 中 ， 使 我 们 感 兴趣 的 是 输出 电路 的 构造 。 
这 种 电路 构造 称 为 开 集 电极 (open coliector) 或 开 涡 极 (open drain)， 取 决 于 所 采用 的 集成 
电路 工艺 类 型 。 就 目前 情况 来 说 ， 开 集 电极 这 个 词 更 通用 ， 所 以 我 们 将 采用 这 种 则 法 。 

开 集 电极 输出 非常 类 似 于 三 态 输出 ， 但 有 一 些 差别 。 回 顾 可 知 ， 三 态 输出 能 够 将 器 件 的 
逻辑 功能 (1 或 0) 与 器 件 的 输出 引 脚 隔离 开 来 。 开 集 电极 器 件 以 类 似 的 方式 工作 ， 但 其 意图 
不 是 隔离 输入 逻辑 和 输出 引 脚 ， 而 是 使 多 个 输出 能 够 连接 在 一 起 来 实现 像 “与 ”和 “或 ”这 
样 的 逻辑 功能 。 当 我 们 通过 将 开 集 电极 门 输出 连接 在 一 起 来 实现 与 函数 时 ， 我 们 称 电路 是 线 
与 (wired-AND) 输出 。 

为 理解 电路 如 何 工作 ， 想 像 你 正在 观察 图 16-1 中 门 的 输出 引 脚 。 如 果 门 输入 是 逻辑 0， 则 
你 会 看 到 开 集 电极 输出 的 “开关 ”是 关闭 的 ， 输 出 连 到 了 地 (逻辑 0)。 如 果 输 入 是 1， 则 输出 
开关 是 打开 的 ， 没 有 连 到 任何 地 方 ， 开 关 处 于 高 阻抗 状态 ， 就 像 一 个 三 态 门 。 因 此 ， 开 集 电 
极 门 有 两 个 输出 状态 ，0 或 者 高 阻抗 。 

图 16-2 图 解 了 一 个 3- 输 入 的 线 与 困 。” 3.3V 
数 。 请 暂时 忽略 标记 为 F1、F2 和 F3 的 
电路 元 件 ， 它 们 是 可 永久 “ 烧 断 ”的 熔 
丝 ， 我 们 将 随后 讨论 它们 的 用 途 。 由 于 
三 个 门 都 是 开 集 电极 器 件 ， 它 们 的 输出 
或 者 连接 到 地 (逻辑 0) ， 或 者 处 于 高 阻 
抗 状 态 。 如 果 所 有 输入 A、B 和 C 都 是 
逻辑 1， 则 三 个 输出 都 是 高 阻抗 。 这 意 
味 着 没有 一 个 输出 连接 到 公共 线 上。 可 
是 ,电阻 将 公共 线 连接 到 了 系统 电源 上 ， 
这 样 你 就 会 看 到 该 线 是 逻辑 1。 不 同 的 
是 逻辑 1 是 由 电源 通过 电阻 来 提供 的 ， 
而 不 是 门 输出 提供 的 。 我 们 将 该 电阻 称 
为 上 拉 电 阻 (pull-up resistor)， 因 为 它 。 图 16-2 3- 输 入 的 线 与 逻辑 函数 。 标 记 为 F1、F2 和 F3 的 电路 
将 线 上 的 电压 拉 到 了 电源 电压 。 符号 是 熔 丝 ， 可 按 特 定 意图 烧 断 ， 从 而 使 门 输出 永 

如 果 输 入 A、B 和 C 是 逻辑 0， 则 该 介 侍 地 从 加 辑 等 式 中 消除 
线 被 连接 到 地 。 电 阻 是 必要 的 ， 它 防止 了 电源 直接 连接 到 地 ， 引 起 短路 ， 产 生 有 趣 的 烟火 和 
气味 。 关 键 是 电阻 将 从 电源 到 地 的 电流 限制 到 了 一 个 安全 值 ， 同 时 也 为 我 们 提供 了 衡量 逻辑 
电 平 的 参考 点 。 而 且 ， 有 多 少 门 输 入 处 于 逻辑 0 是 没有 关系 的 ， 其 效果 都 是 将 线 连接 到 地 ， 从 
而 强制 输出 为 逻辑 0。 

熔 丝 FE1、F2 和 F3 对 电路 加 入 了 另外 的 一 维 。 如 果 有 一 种 蒸发 掉 形 成 熔 丝 的 导线 的 方法 ， 
比方 说 用 大 的 电流 脉冲 ， 那 么 那个 特定 的 开 集 电极 门将 被 完全 地 从 电路 中 移 除 。 如 果 我 们 烧 
掉 熔 丝 FE3 ， 则 电路 就 是 2- 输 入 与 门 ， 包 含 输入 A 和 B 以 及 输出 Y。 当 然 ， 一 旦 我 们 决定 烧 掉 某 
个 熔 丝 ， 我 们 就 不 能 按 原样 恢复 它 。 我 们 称 这 样 的 器 件 为 一 次 性 可 编程 (one-time 
programmable) 器 件 , 即 OTP 器 件 。 

图 16-3 显 示 出 我 们 如 何 扩 展 线 与 函数 的 概念 生成 一 个 能 实现 任意 积 和 逻辑 函数 的 通用 器 
件 , 该 器 件 具 有 4 个 输入 和 2 个 输出 。 图 中 的 圆圈 代表 可 编程 的 交叉 点 开关 (cross-point switch)。 
每 个 开关 可 能 是 一 个 如 图 16-2 所 示 的 OTP 熔 丝 ， 也 可 能 是 一 个 如 同 三 态 门 输出 开关 那样 的 电 
子 开关 。 对 于 电子 开关 ， 我 们 还 需要 配置 某 种 额外 的 存储 器 用 来 存储 每 个 交叉 点 开关 的 状态 ， 


Y=A*B*C 
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或 者 需要 一 些 其 他 的 对 开关 进行 重 编程 的 方法 。 注 意 每 个 输入 是 如 何 通过 输入 / 反 相 盒 转换 成 
输入 和 反 相 输入 的 。 然 后 ， 每 个 输入 
和 反 相 输入 连接 到 阵列 的 每 个 水 平 线 。 
水 平 线 对 该 组 垂直 线 实现 了 线 与 功能 。 
通过 有 选择 地 对 与 平面 (AND plane) 
的 交叉 点 开关 进行 编程 , 每 个 或 (OR) 
门 输出 就 可 成 为 任意 的 单 级 积 和 项 。 
图 16-4 显 示 出 两 个 工业 标准 PAL 
器 件 16R4 和 16L8 的 引 脚 外 观 图 。 参 见 
16L8， 我 们 看 到 它 有 10 个 引 脚 〈 引 脚 
1 到 9 和 引 脚 11) 只 能 用 于 输入 ，6 个 
引 脚 ( 引 脚 12 到 18) 可 设 定 成 输入 或 
输出 ， 两 个 引 脚 〈 引 脚 12 和 19) 只 能 。 图 16-3 一 部 分 可 编程 阵列 逻辑 (PAL) 器 件 的 简化 示意 图 
用 于 输出 。 另 一 个 器 件 16R4 类 似 于 A 
16L8， 但 它 包 括 4 个 DD 型 触发 器 以 便于 设计 简单 的 状态 机 。 
即使 采用 这 些 相 对 简单 的 器 
件 ， 需 要 进行 快速 编程 的 互 连 点 
数量 也 有 成 百 上 千 。 为 控制 复杂 
度 ， 可 编程 器 件 的 编程 工具 制造 
商 Data WO 公司 ' 发 明了 最 早 的 硬 
件 描述 语言 之 一 ， 称 为 ABEL， 这 
是 高 级 布尔 方程 语言 (Advanced 
Boolean Equation Language) 的 简 
写 。ABEL 现 为 一 家 加 州 San Jose 
的 可 编程 硬件 器 件 和 可 编程 工具 
制造 商 Xilinx 所 拥有 。 
ABEL 是 一 个 比 Verilog 或 
VHDL 简 单 的 语言 ， 但 仍 能 定义 图 16-4 工业 界 标准 PAL 器 件 16L8 和 16R4 的 引 脚 外 观 图 
相当 复杂 的 电路 配置 。 这 里 有 一 个 ABEL 源 文件 的 部 分 实例 。 过 程 如 下 所 示 : 
1. 生成 ASCII 源 文件 source.abl。 
2. 编译 该 源 文件 ， 生 成 一 个 编程 图 source.jed。 
3. 将 source.jed 文 件 载 入 到 一 个 器 件 编程 器 (比如 Data IO 开发 的 编程 器 ) 。 对 于 OTP 器 件 ， 
可 通过 “ 烧 断 ”( 消 除 ) 适当 的 熔 丝 来 编程 。 如 果 器 件 可 重 编程 ， 则 打开 适当 的 交叉 点 开关 。 
. 一 些 适当 的 声明 如 下 所 示 。 关 键 字 用 粗 体 显 示 。 


module AND-OR; 





一 | 〇 二 可 编程 互 连 


Co Ty 


J 了 OO 一 @ 





title 


Designer Arnold Berger ” 

Revision 2 

Company University of Washington-Bothell 
Part Number U52 


declarations 


夫 赤 发 展 趋 花 与 可 重 榴 硬件 
” Inputs 
AND-OR Device PAL20V10 : 
al pin 1 ; 
bl pin 2 ; 
b2 pin 3 ; 
b3 pin 4 ; 
b4 pin 5 ; 
cl pin 6 ; 
C2 pin 7 ; 
c3 pin 8 ; 
ca4 pin 9 ; 
ad pin 19 ; 
a3 pin 18 
a2 pin 17 
“Outputs 


istype 
istype 
istype 
istype 
istype 
istype 


Ya 


al # a2 # a3 :; 





‘com, buffer’ ; 
com, buffer’ ; 
‘com, buffer’ 
"Com, buffer 
‘com, buffer’ ; 
‘com, buf fer’ ; 


!zZa al # a2 # a3 ，; 

yb = bl # b2 # b3 # b4 ; 
!Zzbh = bl# b2# b3# b4 ; 
yc = Cl # C2 # c3# cd ，; 
lIzc = Cl 8# C2 # c3 8# cd ; 


Test_vectors 


a4,b1,b2,b3,b4,c1,c2,c3,c4]) -> [ya,za,yb,zb,yc,zc] ; 


( [ al,a2,a3, 
[1,1,1,x,1,1,1,1,1,1,1,1] -> 
[0,1,1,x,0,1,1,1,0,1,1,1] -> 
[1,0,1,x,1,0,1,1,1,0,1,1] -> 
[1,1,0,x,1,1,0,1,1,1,0,1] -> 
[1,1,1,x,1,1,1,0,1,1,1,0] -> 
[0,0,0,x,0,0,0,0,0,0,0,0] -> 
end ; 


你 可 能 对 ABEL 文 件 结构 的 很 多 地 方 都 很 清楚 ， 但 是 源 文件 中 还 是 存在 某 些 部 分 需要 详细 


阐述 : 


。 关键 字 device 用 于 将 一 个 物理 部 件 和 源 模 块 联系 起 来 。 在 这 里 ，AND-OR 电 路 将 被 映射 


到 一 个 20V10 PAL 器 件 。 


。 关 键 字 pin 定 义 了 哪个 局 部 项 被 映射 到 哪个 实际 输入 引 脚 或 输出 引 脚 。 | 
。 关 键 字 istype 用 于 将 一 个 明确 的 电路 函数 分 配 到 一 个 引 脚 。 这 里 输出 引 脚 被 声明 为 既是 


[1,0,1,0,1,0] ; 


[1,0,1,0,1,0] ; 


[1,0,1,0,1,0] ; 
[1,0,1,0,1,0] ，; 
{1,0,1,0,1,0] ; 
[0,1,0,1,0,1] ; 


组 合 的 (combinatorial) 又 是 非 反 向 的 (buffer) 。 


。 在 equations 部 分 ， 符 号 “# ”用 于 表示 逻辑 或 (OR) 函数 。 虽 然 器 件 叫 作 AND-OR 模 块 ， 
但 与 (AND) 部 分 实际 上 是 反 相 逻辑 意义 上 的 与 。 德 摩根 定律 提供 了 用 或 操作 实现 反 


相 逻 辑 与 国 数 的 桥梁 。 


。 关 键 字 test-vectors 人 允许 我 们 为 输入 和 相应 输出 的 有 代表 性 的 状态 提供 一 个 参考 测试 。 编 
译 器 和 编程 器 可 以 用 它 来 验证 逻辑 方程 和 编程 结果 。 
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PLD 很 快 就 被 复杂 可 编程 逻辑 器 件 (complex programmable logic device, CPLD) 超越 了 。 
CPLD 提 供 了 更 多 数量 的 门 和 更 强 的 功能 。 这 两 个 系列 的 器 件 在 可 编程 硬件 应 用 上 仍然 非常 流 
行 。 这 里 的 关键 点 是 产业 标准 硬件 描述 语言 (ABEL) 已 经 为 硬件 开发 者 提供 了 与 软件 开发 者 
相同 (或 近 平 相同 ) 的 设计 环境 。 

演化 过 程 的 下 一 步 就 是 现场 可 编程 门 阵列 (field programmable gate array, FPGA) 的 出 现 。 
FPGA 是 作为 原型 工具 引入 的 ， 其 对 象 是 进行 定制 集成 电路 (如 ASIC) 设计 的 工程 师 。ASIC 
工程 师 面 临 的 是 令 人 旦 惧 的 任务 ， 因 为 赌注 巨大 。 与 软件 不 同 ， 硬 件 故障 是 不 可 原谅 的 。 一 旦 
硬件 制造 过 程 开始 ， 几 十 万 美元 和 数 月 时 间 就 投入 于 制造 部 件 。 因 此 ， 硬 件 设计 者 要 花费 大 量 
的 时 间 对 以 软件 描述 的 设计 进行 模拟 。 简 言 之 ， 他 们 构造 大 量 的 测试 向 量 (如 同 在 前 面 ABEL 
源 文件 中 显示 的 ) ， 并 在 设计 付 诸 制造 前 尽 可 能 多 地 用 这 些 测 试 向 量 对 设计 进行 验证 。 事 实 上 ， 
在 设计 付 诸 制造 前 ， 硬 件 设计 者 在 测试 上 所 花费 的 时 间 与 实际 用 于 设计 所 用 的 时 间 一 样 多 。 

更 糟糕 的 是 ， 全 体 开 发 队伍 通常 必须 要 等 待 直到 设计 周期 的 很 晚 阶段 才能 得 到 和 使 用 硬 
件 。FPGA 的 产生 就 为 这 种 包含 定制 ASIC 器 件 的 硬件 原型 化 问题 提供 了 一 种 解决 方案 ， 但 在 
这 过 程 中 ， 创造 了 一 种 全 新 的 计算 机 体系 结构 的 领域 ， 称 为 可 重 构 计算 (reconfigurable 
computing)。 在 讨论 可 重 构 计 算 之 前 ， 我 们 需要 更 详细 地 考察 FPGA。 在 图 16-3 中 我 们 介绍 了 
交叉 点 开关 的 概念 。 开 关 的 技术 有 多 种 ， 包 括 : 

。 可 熔 链 接 : 开关 初始 都 是 关闭 的 。 通 过 烧 断 熔 丝 使 不 需要 的 连接 断 开 达 到 编程 的 目的 。 

。 反 一 可 熔 链 接 : 链接 初始 是 断 开 的 。 熔 烧 熔 丝 会 引起 开关 单元 永久 性 地 开启 ， 合 上 开关 ， 

使 交叉 导体 连接 上 。 

。 电 可 编程 的 : 交叉 点 开关 是 可 重 编程 器 件 ， 当 用 电流 脉冲 编程 时 ， 它 可 以 保持 自己 的 
状态 直至 被 重 编程 。 这 项 技术 与 在 数字 相机 、MP3 播 放 机 、 计 算 机 中 的 BIOS ROM 中 使 
用 的 FLASH 存 储 器 件 类 似 。 

。 基 于 RAM 的 : 每 个 交叉 点 开关 都 可 连接 到 RAM 存 储 阵 列 中 的 位 。 阵 列 中 的 这 个 位 的 状 
态 就 决定 了 相应 的 开关 是 打开 还 是 关闭 。 显 然 ， 基 于 RAM 的 器 件 可 通过 重 写 配置 存储 
器 中 的 这 些 位 来 快速 地 进行 重 编程 。 

FPGA 引 入 了 另 一 个 新 的 概念 : 查找 表 (look-up table)。 与 PLD 和 CPLD 器 件 采用 线 与 体 
系 结构 且 分 别 用 或 门将 这 些 与 项 结合 在 一 起 来 实现 逻辑 的 做 法 不 同 ， 查 找 表 是 一 个 小 的 RAM 
存储 元 件 ， 可 通过 编程 提供 任何 组 合 逻 辑 方程 。 实 际 上 ， 查 找 表 就 是 一 个 直接 实现 在 硅 上 的 
真 值 表 。 因 此 ， 与 将 真 值 表 作 为 起 点 来 产生 门 级 电路 或 者 用 HDL 实 现 逻 辑 方程 不 同 ， 查 找 表 
只 简单 地 将 真 值 表 看 作 是 RAM 存 储 器 并 直接 实现 逻辑 函数 。 

图 16-5 图 解 了 查找 表 的 概念 。FPGA 可 容易 地 采用 一 组 查找 表 来 实现 ， 通 常 表示 为 5 个 输 
入 和 2 个 输出 的 表 ， 并 带 有 以 D- 触 发 器 形 
式 存在 的 寄存 器 以 及 用 于 对 逻辑 资源 和 
存储 资源 之 间 的 互 连 进行 布线 的 交叉 点 
开关 网 络 。 同 样 ， 时 钟 信 号 也 需要 布线 
以 对 电路 提供 同步 。 

在 图 16-6 中 ， 我 们 看 到 了 一 个 完整 的 
FPGA 体 系 结构 。 访 体系 结构 的 不 同 寻 常 
之 处 是 它 是 完全 基于 RAM 的 。 所 有 布线 和 
组 合 逻 辑 都 在 FPGA 内 通过 对 存储 器 表 进 
行 编程 实现 。 器 件 的 全 部 个 性 化 可 以 很 容 图 16-5 将 逻辑 方程 实现 为 门 或 查找 表 
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易 地 改变 ， 就 像 对 器 件 重 编程 一 样 。 

FPGA 的 引入 对 ASIC 的 设计 方 交叉 点 开关 阵列 
式 有 深远 的 影响 。 虽 然 FPGA 比 定 
制 的 ASIC 昂 贵 得 多 ， 又 不 能 用 时 钟 
同步 得 那样 快 ， 而 且 门 容量 很 低 ， 
可 是 ， 由 于 它 具有 建造 运行 得 和 成 
品 几乎 一 样 快 的 工作 原型 硬件 的 能 
力 ， 所 以 极 大 地 降低 了 ASIC 设 计 的 
固有 风险 ， 大 大 地 缩小 了 基于 ASIC 
产品 所 需 的 开发 时 间 。 

目前 ， 像 Xilinx2 和 Actel3 这 样 
的 公司 都 提供 具有 相当 于 几 百 万 个 
等 价 门 的 FPGA 。 例 如 ，Xilinx 图 16-6 一 部 分 现场 可 编程 门 阵列 的 示意 图 
XC3S5000 包 含 5 百 万 个 等 价 门 ， 并 且 在 封装 中 有 784 个 用 户 IO， 总 共有 1156 个 引 脚 。 其 他 版 
本 的 FPGA 包 含 片 上 RAM 和 乘法 单元 。 

随 着 FPGA 的 流行 ， 相 应 的 软件 支撑 工具 也 成 长 了 起 来 。 对 于 商业 上 可 得 到 的 FPGA， 
ABEL、Verilog 及 VHDL 可 编译 到 配置 图 中 。 像 ARM.、 MIPS 及 PowerPC 这 样 的 系列 微 处 理 器 
都 已 经 端口 化 ， 所 以 可 以 直接 插入 到 商业 FPGA 中 和。 


随 着 FPGA 作 为 独立 器 件 和 原型 化 工具 的 流行 ， 研究 者 和 商业 创业 者 正在 建造 由 数 百 或 数 - 


千 个 互 连 的 FPGA 排 列 而 成 的 可 重 构 数字 平台 。 瞄准 这 些 大 型 系统 的 公司 是 Intel 和 AMD 这 样 
的 公司 ， 它 们 有 经 济 实力 和 建造 复杂 微 处 理 器 的 业务 。 由 于 将 一 种 新 的 微 处 理 器 设计 推 向 市 
场所 具有 的 高 投入 和 高 风险 ， 那些 使 设计 者 能 将 其 设计 的 模拟 加 载 到 硬件 加 速 器 上 并 实际 运 
行 适当 时 间 的 系统 就 成 了 非常 重要 的 工具 。 

通过 以 解释 模式 运行 Verilog 或 VHDL 设 计 文件 的 方式 ， 完 全 用 软件 模拟 一 个 微 处 理 器 就 
成 为 可 能 ， 这 时 在 每 秒 中 ， 模拟 可 能 只 在 被 模拟 时 钟 周 期 的 10 或 100 的 整数 倍 处 运行 。 想 像 你 
试图 要 在 一 个 以 5KHz 运 行 的 计算 机 上 启动 操作 系统 。 在 美国 ， 有 两 个 互相 竞争 的 企业 
Quickturn 和 PiE 生 产 和 销售 大 型 的 可 重 构 硬件 加 速 器 (hardware accelerator) 。 硬 件 加 速 器 这 
个 术语 是 指 这 些 机 器 在 相关 方面 的 使 用 。 不 是 试图 用 软件 来 模拟 像 微 处 理 器 这 样 的 复杂 数字 
设计 ， 而 是 将 设计 装载 到 硬件 加 速 器 中 并 以 接近 1MHz 的 速度 运行 。 

Quickturn 和 PiE 后 来 合并 了 ， 然 后 又 卖 给 了 加 州 San Jose 的 Cadence Design Systems 。 
Cadence 是 世界 上 最 大 的 电子 设计 自动 化 (EDA) 工具 的 供应 商 。 

当 这 些 硬 件 加 速 器 最 初出 现时 ， 其 成 本 大 约 是 每 个 等 价 门 1 美元 。 Quickturn 的 最 早 的 主要 
商业 应 用 之 一 就 是 Intel 通 过 将 若干 个 硬件 加 速 器 连接 成 一 个 大 型 系统 来 完成 对 整个 奔腾 处 理 
器 的 模拟 。 他 们 能 够 在 几 十 分 钟 内 将 系统 引导 到 DOS 提 示 符 下 5。 

当 商 业 部 门 正 将 其 注意 力 集中 在 硬件 加 速 器 的 时 候 ， 其 他 研究 者 正在 为 可 重 构 计算 机 的 
可 能 应 用 进行 实验 。 那 时 我 作为 其 中 一 成 员 的 HP 公司 实验 室 的 一 个 研究 组 正在 建造 一 个 定制 
的 可 重 构 计算 机 ， 用 于 进行 研究 和 硬件 加 速 两 种 用 途 s。 HP 机 器 的 不 同 之 处 在 于 其 采用 的 新 颖 
的 用 于 设计 布线 的 方法 使 其 能 在 几 百 个 互 连 的 FPGA 中 进行 适当 的 划分 。 


所 有 FPGA 必 须要 处 理 的 最 大 问题 之 一 就 是 最 大 化 片上 资源 的 利用 率 ， 访 利用 率 受 限于 可 


使 用 的 布线 资源 。 只 有 50% 的 可 使 用 逻辑 资源 能 够 在 FPGA 内 布线 是 很 平常 的 事情 ， 需 要 非常 
复杂 的 布线 算法 来 处 理 所 有 的 细节 问题 。 一 个 单 FPGA 的 布线 耗费 几 个 小 时 是 很 平常 的 事 ， 而 
像 可 重 构 计算 机 这 样 的 复杂 设计 ， 即 使 是 布线 算法 分 布 在 一 个 UNIX 工 作 站 集群 上 ， 也 需要 儿 


人 
CN 








连接 。 每 个 PALE 由 一 个 6- 输 入 、2- 输 出 的 
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周 的 布线 时 间 。 

产生 这 种 状况 有 几 个 原因 ， 但 主要 原因 是 商业 上 可 得 到 的 FPGA 没 有 设计 成 互 连 阵列 ， 而 
是 设计 成 了 独立 的 ASIC 原 型 工具 ， 它 们 的 逻辑 资源 富足 但 布线 资源 有 限 。 其 原因 很 容易 理解 ， 
在 一 个 大 的 FPGA 阵 列 中 ， 信 号 可 能 需要 穿 过 某 些 FPGA， 其 目的 只 是 到 达 其 他 FPGA。 这 样 ， 
即使 没有 使 用 片上 逻辑 资源 ， 也 消耗 了 布线 资源 。 

HP 的 团队 采取 了 一 种 不 同 的 途径 。 从 一 开始 ， 他 们 就 确信 要 始终 服从 Rent 规 则 。Rent 规 
则 在 20 世 纪 60 年 代 首先 被 JBM 的 Richard Rent 所 阐明 。 他 将 结果 写 在 一 个 内 部 备忘录 中 ， 从 未 
发 表 过 ， 虽 然后 来 的 研究 者 "验证 了 该 结果 的 正确 性 。 

Rent 当 时 正在 研究 的 是 ;在 一 个 印刷 电路 板 上 ， 组 件 的 数量 以 及 它们 之 间 互 连 线 的 数量 
与 支撑 电路 所 要 求 的 输入 和 输出 数量 之 间 有 什么 关系 。Rent 能 用 数学 方程 表达 这 种 关系 : 

N = kx G* 
其 中 : 

N= 进入 任意 部 分 或 电路 器 件 群 组 的 VO 信号 数量 。 

k= 每 个 器 件 的 平均 I/O 数 量 。 

G= 在 该 部 分 中 器 件 的 数量 。 

e= 在 0.5<e<0.7 范 围 内 的 指数 。 

图 16-7 用 只 有 几 个 门 的 简单 情况 对 
Rent 规 则 作 了 图 解 。 

这 里 我 们 看 到 有 6 个 IO 引 脚 进 入 该 
部 分 。 每 个 门 有 3 个 IO 引 脚 ， 而 该 部 分 
内 有 4 个 门 。 取 e=0.5 时 ， 用 Rent 规 则 为 
该 部 分 建 模 是 正确 的 。 指 数值 可 在 一 个 





小 范围 内 变化 ， 这 是 因为 不 同 的 电路 种 图 167 Rent 规 则 
类 (比如 非常 规整 的 存储 器 阵列 ) 所 导 oa 网 
致 的 结果 与 随机 逻辑 阵列 不 同 。 


Rent 规 则 可 用 于 预测 支撑 任意 器 件 群 
组 所 必需 的 布线 (IO) 数量。 为 设计 一 
个 遵循 Rent 规 则 的 可 重 构 计算 机 ，HP 设 Frrrrrr 
计 了 一 个 称 为 Plasma 芯片 的 定制 FPGA。 -| 
Plasma 是 “Programmable Logic And 
Switch Matrix”8 的 缩写 词 。Plasma 芯 片 
的 版 图 示意 图 由 图 16-8 给 出 。 一 一 一 

每 个 PLASMA 芯片 包含 16 组 ， 每 组 16 。 HITTITT 
个 可 编程 原子 过 辑 元 件 (Programmable 
Atomic Logic Element, PALE)。16 个 PALE 
组 成 的 组 带 有 自己 的 称 为 Hextant 的 交叉 互 ”HHEEFFFER 


HH 
中 心 交叉 开 


[TTITTIIT 关 (部 分 的 ) 


查找 表 组 成 ， 后 接 一 个 DD 型 存储 寄存 器 。 

每 个 hextant 都 馈 入 一 个 大 的 中 心 交 又 矩阵 。 
中 心 交叉 矩阵 只 被 占用 了 四 分 之 一 ， WO 引 脚 

这 意味 着 只 有 1/4 的 主 信 号 线 与 给 定 的 图 16-8 PLASMA 芯片 的 示意 图 
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hextant 信 号 线 相连 。 这 样 做 是 出 于 空间 的 考虑 。 就 这 样 ， 中 心 交叉 矩阵 包含 400 条 垂直 线 和 
1600 条 来 自 hextant 的 线 。Rent 规 则 总 是 会 被 遵守 ， 因 为 这 样 可 以 确保 电路 上 不 产生 无 法 布 通 
线 的 情况 。 图 16-9 显 示 了 一 个 PLASMA 芯片 的 照片 。 照 片 的 显著 之 处 在 于 布线 资源 和 逻辑 资 
源 的 相对 大 小 ， 这 是 为 了 强调 Rent 规 则 在 为 广义 的 可 重 构 计 算 机 提供 环境 模型 方面 的 重要 性 。 
在 前 面 的 章节 中 ， 我 们 讨论 了 如 何 用 总 线 承载 信息 在 机 器 中 传输 。 这 里 ， 我 们 看 一 下 为 了 指 
引 数据 在 机 器 内 任意 布线 ， 总 线 结构 的 大 小 为 何必 须要 增长 。 

HP 团队 制造 的 可 重 构 计算 机 称 为 
Teramac。Teramac 每 秒 执行 1012 次 门 操 作 (在 
IMHz 频 率 下 有 1 百 万 门 在 进行 开关 ) ， 因 此 用 
“Tera” 做 前 级 。 由 于 是 可 重 构 的 ， 故 称 为 多 
体系 结构 计算 机 (mac)。 

Teramac 包 含 1728 个 Plasma 芯 片 ， 排 列 成 
复杂 的 网 络 。 通 过 遵循 Rent 规 则 ， 任 何 
Plasma 心 片上 的 任何 PALE 都 可 被 连接 到 其 他 
芯片 的 PALE 上 。 

Teramac 的 另 一 个 方面 是 独特 的 ， 可 能 与 
本 章 关于 计算 的 未 来 问题 更 相关 。Teramac 是 
容 缺 陷 的 。Plasma 芯 片 或 它们 之 间 的 互 连 可 
能 存在 缺陷 ， 但 机 器 仍然 能 工作 。 在 某 种 程 
度 上 ， 容 缺陷 设计 的 体系 结构 与 你 硬盘 驱动 
器 的 类 似 。 很 少 有 磁盘 是 完美 的 ， 每 个 表面 图 16-9 PLASMA 芯片 的 照片 
或 盘 都 可 能 包含 小 缺陷 ， 从 而 致使 一 个 或 多 
个 磁 位 不 可 读 。 在 对 磁盘 进行 低级 格式 化 过 程 中 缺陷 区 域 会 被 标记 出 来 ， 所 以 不 用 将 整个 磁 
盘 扔 掉 。 磁 盘 的 一 个 特殊 区 域 存储 了 标记 信息 ， 使 得 坏 区 域 不 会 被 使 用 。 

目前 , 微 处 理 器 成 品 率 的 典型 测量 值 低 于 25%, 这 意味 着 圆 片上 的 芯片 有 75% 是 有 缺陷 的 。 
原因 是 现代 微 处 理 器 为 保证 能 工作 就 必须 是 完美 的 。Teramac 体 系 结构 就 没有 这 种 限制 。 在 测 
试 过 程 中 ， 在 机 器 上 运行 具有 某 种 特性 的 软件 。 当 结果 返回 时 ， 测 试 电路 不 能 正确 运行 的 区 
域 将 被 映射 出 设计 数据 库 。 电 路 采用 伪 随 机 数 生成 电路 来 测试 ， 电 路 包含 一 个 由 DD 型 触发 器 组 
成 的 32 级 移 位 寄存 器 。 移 位 寄存 器 的 每 一 级 馈 和 人 一 个 3 输入 XOR 门 。XOR 门 的 输出 作为 输出 
馈 入 下 一 级 。 每 个 XOR 门 余下 的 两 个 输入 随机 地 连接 到 其 他 31 级 的 Q 输 出 。 

采用 这 个 电路 可 产生 长 串 的 伪 随 机 数 。 如 果 在 电路 中 检测 到 故障 ， 则 随机 数 串 将 与 期 望 
结果 有 重大 的 偏离 。 这 种 测试 称 为 标记 分 
析 (signature analysis) ， 也 用 于 在 印刷 电 
路 板 上 检测 开路 和 短路 。 为 了 检测 一 个 缺 
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并 进行 测试 。 如 果 检 测 到 缺陷 ， 故 障 电路 
的 每 个 元 件 将 被 再 一 次 当 作 垂 直 测 试 电路 
的 一 部 分 进行 独立 的 测试 。 缺 陷 源 存在 于 
两 个 故障 测试 的 交集 ， 见 图 16-10。 

在 Plasma 心 片 本 身 内 部 ， 只 有 7% 的 芯 
片区 域 被 看 作 是 关键 的 ， 这 意味 着 在 这 个 图 16-10 Teramac 系 统 的 缺陷 检测 方案 
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区 域内 的 一 个 或 多 个 缺陷 将 导致 电路 无 法 使 用 。 这 意味 着 在 Plasma 芯片 上 或 芯片 之 间 还 可 能 
存在 大 量 其 他 的 缺陷 ， 但 系统 却 仍 能 工作 。 然 而 ， 在 该 机 器 上 测试 系统 缺陷 ， 仅 测试 16 个 电 
路 板 中 的 一 个 就 要 用 去 一 周 多 的 时 间 。 

现在 ， 我 们 最 终 得 到 了 所 有 以 前 讨论 的 原因 。 在 很 多 情况 下 ， 我 们 将 算法 的 硬件 解决 方 
案 和 软件 解决 方案 之 间 看 作 是 平行 的 关系 。 硬 件 可 以 很 容易 地 将 特定 的 算法 加 速 一 千 倍 或 更 
高 。 想 想 你 视频 卡 上 的 图 形 处 理 器 芯片 ， 想 像 一 下 如 果 CPU 自 己 计算 所 有 的 图 像 转换 ， 枪 战 
游戏 怎么 玩 。 

硬件 由 于 能 并 行使 用 专用 资源 而 加 速 了 算法 解 。 典 型 的 情况 是 算法 需要 多 少 硬 件 资 源 ， 就 
使 用 多 少 。 如 果 你 需要 处 理 一 个 1024 位 的 图 像 向 量 ， 那 么 就 可 以 使 用 一 个 1024 位 的 寄存 器 组 。 

事实 上 ， 假 如 设计 了 适合 的 算法 并 加 载 到 Teramac 中 ， 有 人 估计 ""， 像 Teramac 这 样 的 机 
器 在 1MHz 频 率 运行 时 ， 其 执行 DNA 串 匹配 算法 的 速度 要 比 最 快 的 通用 超级 计算 机 快 1000 倍 。 
像 Teramac 这 样 的 机 器 的 另 一 个 应 用 领域 是 数据 加 密 和 安全 。 破 解密 码 和 产生 不 可 破解 代码 都 
需要 未 来 计算 机 具有 执行 大 规模 并 行 计算 的 能 力 。 例 如 ， 目 前 最 快 的 计算 机 需要 几 十 亿 年 才 
能 对 一 个 300 位 的 密 钥 解码 。 当 然 ， 目 前 研究 者 也 在 研究 将 大 量 传 统计 算 机 结合 成 并 行 网 络 
这 种 途径 。SETI 计 划 (Search for Extraterrestrial Intelligence) 就 是 这 样 一 个 例子 。 当 你 的 PC 
空闲 时 你 可 以 自愿 将 它 出 借 给 SETI， 该 计划 将 利用 它 分 析 来 自 射电 望远镜 的 数据 。 

现在 ， 想 像 一 下 在 未 来 某 个 时 间 ， 我 们 的 计算 机 由 大 量 像 FPGA 阵 列 的 自由 资源 组 成 。 未 
来 的 编译 器 在 编译 目标 代码 的 同时 ， 也 编译 用 来 实现 解决 方案 的 最 优 体系 结构 。 如 果 这 样 来 
设计 硬件 ， 即 配置 存储 器 可 快速 地 用 一 个 块 存储 器 转移 指令 来 加 载 ， 就 有 可 能 在 每 个 函数 调 
用 时 将 硬件 重 配置 成 最 优 配置 。 

虽然 这 看 起 来 牵强 ， 但 公司 已 经 在 建造 这 种 体系 结构 的 早期 型 式 。 加 州 Mountain View 的 
Triscend 公 司 "建造 了 可 配置 的 片上 系统 平台 。 这 些 产 品 包 含 自 由 的 逻辑 和 布线 资源 ， 这 些 资 
源 环 绕 一 个 具有 工业 标准 的 微 处 理 器 核 。 将 配置 存储 器 映射 到 微 处 理 器 的 存储 空间 ， 这 样 它 
就 能 按 实现 W/O 设备 (如 以 太 网 控制 器 、 定 时 器 、 端 口 ， 等 等 ) 的 需要 对 外 设 硬件 进行 重 配置 
了 。 同 样 ， 自 由 的 门 可 配置 为 算法 加 速 器 ， 如 浮 点 单元 、 图 形 处 理 器 之 类 。Triscend A7 系 列 
包含 一 个 由 门 海 环 绕 着 的 ARM7TDMI 处 理 器 核 。 


16.3 分 子 计算 


计算 机 产业 最 令 人 惊异 的 就 是 摩尔 定律 的 确实 性 。 自 从 Intel 创 始 人 Gordon Moore 在 1965 
年 首次 提出 以 来 “， 摩 尔 定律 在 预测 集成 电路 密度 呈 指 数 增长 方面 一 直 令 人 惊奇 地 准确 。 集 成 
电路 工艺 技术 的 进步 起 到 了 推动 作用 。 最初 在 1971 年 出 现 的 Intel 4004 处 理 器 有 2 250 个 晶体 管 ， 
而 2000 年 出 现 的 奔腾 4 处 理 器 有 42 000 000 个 晶体 管 。 

器 件 物理 学 家 已 经 在 预言 摩尔 定律 在 不 久 的 将 来 可 能 就 会 开始 瓦解 。 这 并 不 是 说 计算 机 
就 会 停止 在 复杂 性 和 处 理 能 力 上 提高 ， 而 是 对 半导体 器 件 持续 无 限制 缩小 的 能 力 的 表述 。 这 
些 限 制 中 有 些 是 经 济 上 的 ， 有 些 与 物理 定律 有 关 。 

经 济 因 素 能 轻易 地 促使 在 方向 上 的 改变 。 每 次 集成 电路 制造 工艺 前 进一步 ， 设 备 的 资金 
成 本 就 相应 提高 。 你 可 以 说 摩尔 定律 对 于 制造 成 本 来 说 仍 是 成 立 的 。 目 前 ， 我 们 几乎 处 在 使 
用 光波 让 电路 掩 膜 感光 的 能 力 的 极限 。 随 着 集成 电路 的 尺寸 持续 缩小 ， 就 有 必要 使 用 如 同步 
加 速 器 这 样 的 高 能 辐射 源 来 产生 硅 圆 片 曝光 所 需要 的 那 种 “ 光 ”。 

物理 定律 甚至 更 为 苛刻 。 随 着 尺寸 缩小 ， 量 子 力学 效应 将 变 得 更 显著 。 我 们 已 经 利用 了 
量子 效应 来 为 FLASH 存 储 设备 编程 。 通 过 对 FLASH 存 储 单元 施加 一 个 电压 脉冲 ， 量 子 力学 效 
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人 外 穿 过 二 氧化 硅 绝 缘 层 “注入 ”电荷 载体 。 当 脉冲 移 走 后 ， 电 荷 就 陷于 绝缘 层 的 

一 侧 。 随 着 我 们 不 断 缩小 尺寸 ， 就 需要 越 来 越 小 的 电压 来 使 绝缘 层 降 低 ， 电 荷 逃 逸 的 可 能 
从 就 将 荐 加 并 导致 电路 不 再 可 靠 。 

尺寸 缩小 所 产生 的 另 一 个 效应 称 为 电 迁 移 (electromigration)。 在 这 里 导体 路 径 变 得 如 此 
之 小 ， 以 至 于 实际 上 电子 流 能 在 其 扫 过 的 金属 导体 中 形成 杂质 。 这 股 “ 电 子 风 ”将 会 把 杂质 
移动 到 一 个 它们 可 以 聚集 的 区 域 ， 并 最 终 导致 电路 失效 。 

当然 IC 制造 工程 师 和 器 件 物理 学 家 将 继续 研究 这 些 制 造 问题 ， 在 未 来 几 年 我 们 将 继续 建 
造 密度 更 高 的 电路 。 但 是 ， 显 然 我 们 不 能 持续 地 缩小 电路 元 件 的 尺寸 直至 它们 达到 电子 和 亚 
原子 粒子 的 尺寸 。 我 们 能 吗 ? 

Teramac 以 一 种 非常 令 人 信服 的 方式 显示 出 ， 采 用 “ 非 完美 ”策略 建造 高 度 并 行 、 可 重 构 
的 计算 机 仍 是 可 行 的 。 让 我 们 简要 认识 一 下 这 种 技术 。 

建造 单个 分 子 组 成 的 阵列 ， 以 模仿 目前 的 逻辑 和 其 他 电子 电路 组 件 行为 是 可 能 的 ， 分 子 
电子 学 就 是 基于 这 个 前 提 。 各 种 团队 正在 研究 在 分 子 中 存储 电荷 和 影响 分 子 导电 性 的 方法 ， 
使 之 很 像 目 前 MOS 晶 体 管 的 行为 。 其 他 课题 组 已 经 用 有 机 分 子 制造 出 基本 的 罗 辑 函数 
(AND 门 )。 

该 研究 的 商业 可 行 性 目前 还 难以 估计 (至 少 对 于 我 是 这 样 )。 清 楚 的 是 这 些 “ 器 件 ” 的 尺 
二 要 比 目 前 最 小 的 集成 电路 至 少 小 1000 倍 。 当 然 ， 还 需要 满 屋子 非常 昂贵 的 仪器 才能 使 分 子 
开关 进行 “开关 ”， 但 那 只 是 因为 我 们 看 到 的 技术 还 处 于 婴儿 期 。 回 忆 一 一 下 过 去 是 明 管 的 ， 最 

初 的 Eniac 计 算 机 有 17 000 个 真空 管 ， 充 满 了 宾夕法尼亚 大 学 的 一 间 屋 子 ， 在 20KHz 的 时 钟 速 
率 下 运行 时 ， 一 开机 整个 费城 的 灯 就 都 变 暗 了 。 

要 实现 分 子 计 算 机 还 有 很 多 巨大 的 障碍 必须 克服 。 例 如 ， 什 么 是 线 ? 你 如 何 将 分 子 互 
连 使 得 电流 能 容易 地 在 它们 之 间 流 动 ? 另 一 个 问题 ， 你 如 何 检测 这 些 电路 中 微小 的 信 
号 ? 目前 使 用 的 满 屋子 的 强大 分 析 工 具 不 适合 在 宿舍 中 用 ， 在 宿舍 中 适用 的 是 简便 的 腑 
上 型 电脑 。 

这 样 ， 基 本 问题 就 归结 为 寻找 与 这 些 基 本 电路 元 件 等 价 的 分 子 元 件 :18 

。 开关 器 件 : 与 晶体 管 等 价 的 分 子 器 件 。 

。 存储 单元 。 

。 互 连 技术 。 

。 信 号 放大 。 


16.4 局 部 时 钟 


我 想 讨论 的 最 后 一 个 未 来 趋势 就 是 局 部 时 钟 的 概念 。 在 观察 这 个 现象 之 前 ， 我 们 应 该 花 
一 些 时 间 探 究 一 下 我 们 要 解决 的 问题 。 首 先 让 我 们 界定 一 下 这 个 问题 。 在 写 这 本 书 的 时 候 
(2004 年 8 月 )， 最 快 的 微 处 理 器 时 钟 频率 将 近 3.5GHz。 预 测 我 们 将 会 在 第 二 年 左右 轻易 地 达 
到 5GHz， 达 到 10GHz 也 是 不 远 的 事情 。 

5GHz 的 时 钟 速率 对 应 于 200 皮 秒 (ps) 的 时 钟 周期 。 由 于 在 自由 空间 中 光速 大 约 是 每 纳 
秒 12 英 寸 ， 而 通过 导线 的 速度 大 约 是 每 纳 秒 6 英寸 ， 所 以 这 意味 着 在 200 皮 秒 时 间 光 能 传播 大 
约 1.2 英 寸 。 现 代 微 处 理 器 每 边 大 约 是 3/4 英 寸 ， 这 意味 着 62% 的 时 钟 周 期 将 浪费 在 只 是 使 时 钟 
信号 从 一 边 传播 到 另 一 边 。 由 于 微 处 理 器 是 全 同步 的 机 器 ， 这 就 是 一 个 非常 严重 的 问题 。 我 
们 将 该 问题 称 为 时 钟 偏差 (clock skew)。 时 钟 偏差 就 是 时 钟 各 相应 部 分 之 间 在 时 间 上 的 差异 
(相差 )， 这 是 由 时 钟 向 芯片 所 有 部 分 同时 散布 所 引起 的 问题 。 在 Teramac 中 ， 时 钟 偏差 是 一 个 
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主要 的 设计 问题 ， 必 须 在 机 器 设计 的 所 有 元 件 中 作为 考虑 因素 。 还 有 ， 最 初 的 Cray 超 级 计算 
机 控制 时 钟 偏差 的 办 法 是 通过 调节 同 轴 电 缆 的 长 度 ， 这 些 电缆 会 将 时 钟 运载 到 机 器 上 的 不 同 
电路 板 。 

另 一 个 潜在 的 问题 是 所 有 的 晶体 管 并 不 是 精确 地 以 相同 的 方式 进行 开关 。 芯 片 不 同 部 分 
的 时 钟 电 路 的 开关 特性 会 存在 细微 差别 。 测 量 显示 这 些 在 开关 特性 上 的 差别 会 大 到 约 
180ps“。 这 样 ， 随 着 芯片 变 得 越 来 越 大 、 越 来 越 快 ， 我 们 使 时 钟 在 芯片 上 均匀 分 布 的 能 力 就 
更 成 问题 了 。 

目前 ， 大 多 数 时 钟 的 分 布 网 络 是 层次 化 的 。 图 16-11 显 示 出 一 个 典型 的 时 钟 分 布 网 络 。 标 记 
为 锁 相 环 (phase-locked loop) 的 电路 模块 表示 的 是 现代 计算 机 将 内 部 时 钟 频率 乘 倍 到 大 于 外 
部 时 钟 输入 所 采用 的 方法 。 例 如 ， 如 果 外 部 时 钟 频 率 是 200MHz， 你 在 BIOS 中 设 定 或 锁 在 芯片 
中 的 乘 因子 是 11。 那 么 ， 内 部 时 钟 频率 就 是 2200MHz， 即 2.2GHz。 你 可 能 会 看 到 ，IC 制 造 过 程 
参数 的 一 个 简单 变化 就 会 导致 时 钟 偏差 问题 ， 因 为 时 钟 要 分 布 到 芯片 上 所 有 的 同步 电路 中 。 


外 部 时 钟 输入 


锁 相 环 (PLL) 





图 16-11 同步 时 钟 分 布 网 络 


回顾 可 知 ， 现 代 处 理 器 是 流水 线 驱动 的 器 件 ， 在 流水 线 的 不 同 级 内 不 同 的 组 合 逻 辑 电路 
在 发 挥 作用 。 所 有 的 级 都 由 同一 个 同步 时 钟 驱动 ， 如 图 16-12 所 示 。 这 里 我 们 就 可 领会 为 什么 
限制 时 钟 偏差 是 如 此 的 关键 。 流 水 线 的 每 一 级 必须 在 时 钟 到 来 之 前 完成 它 的 工作 ， 以 将 结果 
锁 存 到 流水 线 的 下 一 级 。 流 水 线 每 级 的 组 合 逻 辑 就 取决 于 它 在 下 一 个 时 钟 沿 到 来 之 前 完成 工 
作 所 需要 的 时 间 预 算 。 时 钟 沿 的 偏差 意味 着 流水 线 的 某 些 级 被 时 钟 触发 的 时 间 比 其 他 级 早 ， 
破坏 了 流水 线 的 同步 性 。 





图 16-12 带 有 同步 时 钟 的 流水 线 
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现在 ， 让 我 们 稍微 修改 一 下 体系 结构 ， 允 许 每 个 组 合 模块 按 其 自己 的 步调 运行 。 图 16-13 


给 出 了 异步 时 钟 触发 流水 线 的 示意 图 。 

在 流水 线 的 每 一 级 ， 系 统 时 钟 用 于 驱动 局 部 时 钟 控制 器 。 然 而 ， 由 于 流水 线 的 每 一 级 都 
是 自主 的 ， 所 以 它 的 局 部 时 钟 既 不 用 前 一 级 的 时 钟 来 同步 ， 也 不 用 后 一 级 的 时 钟 来 同步 。 

当 某 个 级 的 组 合 逻 辑 完成 了 其 工作 时 ， 该 级 的 逻辑 就 会 向 局 部 时 钟 控 制 器 输出 一 个 请 求 ， 
将 结果 锁 存 到 馈 人 下 一 级 的 D 寄 存 器 。 当 数据 锁 存 到 下 一 级 的 输入 寄存 器 时 ， 局 部 时 钟 控制 器 
就 会 向 下 一 级 发 出 一 个 确认 信号 ， 指 示 数 据 有 效 并 可 以 使 用 。 纯 粹 的 效果 就 是 我 们 建立 了 一 
个 在 级 间 进 行 握手 控制 (handshake control) 的 流水 线 。 每 一 级 必须 请 求 数据 传输 ， 而 锁 存 机 
制 用 传输 确认 向 下 一 级 作出 响应 。 

这 个 方案 的 缺点 是 : 因为 局 部 时 钟 不 是 同步 的 ， 所 以 握手 控制 就 可 能 错过 时 钟 党， 数据 
就 可 能 不 得 不 等 待 男 一 个 时 钟 才能 传送 到 下 一 级 。 由 于 每 一 级 要 等 待 前 一 级 完成 ， 流 水 线 中 
的 这 种 延迟 就 很 容易 反 向 传播 并 使 流水 操作 拖延 。 然 而 ， 当 我 们 要 求 处 理 器 以 超过 10GHz 的 
时 钟 速度 运行 时 ， 这 个 方案 的 优势 可 能 就 远大 于 其 缺点 。 假 定 我 们 还 能 建造 能 够 以 如 此 高 的 
时 钟 速 率 运行 的 数字 有 还 辑 电路 ， 那 么 局 部 时 钟 也 许 是 唯一 的 解决 方案 。 


系统 时 钟 





图 16-13 带 有 异步 时 钟 体系 结构 的 流水 线 


这 就 提出 一 个 有 趣 的 问题 ,， “为 什么 还 要 采用 时 钟 ? ”我 们 能 建立 一 个 完全 异步 〈 无 时 钟 ) 
的 计算 机 吗 ? 根据 Marculescu 等 人 的 意见 ”， 全 异步 设计 可 能 还 有 很 长 的 路 要 走 。 用 于 现代 处 
理 器 设计 和 验证 的 计算 机 辅助 设计 (CAD) 工具 还 没有 能 力 来 处 理 全 异步 的 设计 。 此 外 ， 还 
有 一 个 情 性 的 问题 。 我 们 就 是 不 用 这 种 方法 来 设计 计算 机 。 然 而 ， 局 部 时 钟 仍 是 解决 时 钟 偏 
差 问 题 的 一 个 可 行 的 折 中 方案 。 

已 经 有 几 个 新 创立 的 公司 要 利用 全 异步 微 处 理 器 设计 的 思想 了 。Fulcrum Microsystems“ 
就 源 于 加 州 理工 学 院 的 工作 。 图 16-14 说 明了 异 


步 处 理 器 的 一 个 潜在 优势。 pe 






对 于 异步 系统 ， 流 水 线 中 的 数据 以 其 自身 的 | 二 一 制造 裕 量 
速率 流动 。 需 要 额外 的 电路 来 防止 失控 情况 , 而 ”一 一 时 钟 拌 动 、 偏 差 裕 量 
在 传统 的 时 钟 驱动 的 微 处 理 器 系统 中 是 采用 时 钟 。 无 时 钟 逻辑 的 全 一 了 靖 风 


和 寄存 器 来 防止 失控 的 。 WN A. 
这 个 概念 类 似 于 局 部 时 钟 的 使 用 ， 但 在 这 种 ” 图 16-14 无 时 钟 逻辑 相对 于 传统 时 钟 触发 逻辑 
情况 中 ， 需 要 额外 的 逻辑 来 检测 什么 时 候 某 一 级 的 优势 。 来 源 于 Fulcrum Microsystems 


人 
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完成 了 其 工作 ， 以 使 流水 线 的 下 一 级 能 够 工作 。 图 16-15 显 示 了 这 种 情况 。 


输入 完 
成 检测 





图 16-15 无 时 钟 流水 线 。 来 源 于 Fulcrum Microsystems 


总 结 


在 第 16 章 ， 我 们 讲述 了 : 

可 编程 逻辑 器 件 的 体系 结构 。 

现场 可 编程 门 阵列 的 体系 结构 。 

基于 现场 可 编程 门 阵列 来 开发 可 重 构 计算 机 。 

分 子 计算 、 局 部 时 钟 及 无 时 钟 计算 机 的 未 来 发 展 趋势 。 
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习题 
1. 考 虑 下 图 所 示 的 一 部 分 PLD 电路 。 烧 断 的 熔 丝 用 黑 实体 表示 ， 连 接 的 熔 丝 用 空白 圆 表示 。 复 
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制 一 份 该 图 ， 通 过 填充 你 要 烧 断 的 表示 互 连 的 圆 来 对 器 件 进行 “编程 "。 编 程 实现 逻辑 方程 : 
X=(A@B)+C*D 





〇 = 完好 熔 丝 
下 @ = 烧 断 熔 丝 





3. 类 似 下 图 显示 的 电路 ， 包 含 16~32 级 ， 在 容 缺 陷 的 计算 机 器 中 用 于 检测 有 缺陷 的 互 连 元 件 或 
有 缺陷 的 逻辑 元 件 。 为 什么 这 个 电路 是 这 种 任务 的 特别 好 的 选择 ? 


在 所 有 Q 输 出 间 ，XOR 门 的 输入 是 随机 (均匀 ) 分 布 的 


来 自前 一 级 





4. 假 设 你 想 设计 一 个 具有 10GHz 时 钟 速 率 的 同步 CPU。 最 坏 情 况 下 通过 逻辑 门 的 传播 延迟 是 
28 皮 秒 。 流 水 线 的 每 一 级 都 有 不 超过 3 级 的 逻辑 电路 。 考 虑 到 制造 的 不 确定 性 、 器 件 启动 时 
间 以 及 电路 中 器 件 开关 特性 的 差异 ， 你 还 需要 保持 10 皮 秒 的 安全 裕 度 。 这 个 设计 所 能 容 恕 ”L436 
的 时 钟 路 径 长 度 的 最 大 差异 大 约 是 多 少 ? 





附录 奇数 号 习题 答案 


第 1 章 奇 数 号 习题 答案 


1. 摩尔 定律 说 ， 在 一 个 集成 电路 硅 模 上 的 晶体 管 数量 大 约 每 18 个 月 加 倍 。 由 于 电路 设计 者 能 
在 单 块 硅 模 上 放置 的 晶体 管 数量 持续 地 增加 ， 这 意味 着 所 使 用 的 计算 机 和 存储 器 的 复杂 性 
也 在 增加 。 而 且 ， 由 于 晶体 管 数 量 在 增加 ， 唱 体 管 尺寸 在 减 小 ， 所 以 晶体 管 被 更 紧密 地 安 
置 ， 电 信号 的 传输 距离 也 在 下 降 ， 这 意味 着 电路 能 更 快速 地 运行 。 

于 是 ， 存 在 两 种 效应 。 计 算 机 能 在 诸如 总 线 宽度 和 复杂 性 等 方面 取得 更 高 的 性 能 ， 因 
为 我 们 可 以 利用 放置 于 单个 硅 模 上 的 电路 数量 这 个 优势 ， 而 且 ， 这 些 复杂 设计 可 以 更 快 地 
运行 。 最 后 ， 复 杂 电 路 设计 甚至 允许 运行 更 复杂 的 软件 应 用 程序 ， 因 为 我 们 有 更 快速 、 更 
大 容量 的 存储 器 来 实现 算法 。 

. 抽象 层次 概念 的 一 个 优点 是 : 你 能 够 隐藏 较 低 层次 的 细节 和 差异 ， 使 得 在 较 高 层次 的 程序 
只 需 编写 一 次 就 能 在 很 大 范围 的 不 同 机 器 上 运行 。 一 个 缺点 是 : 在 你 调用 较 低 层次 的 国 数 
时 ， 若 必须 穿 过 不 同 的 层次 并 在 每 一 步 做 转换 ， 那 么 就 可 能 会 损失 效率 。 

.半导体 存储 器 平均 比 硬盘 驱动 器 快 342 857 倍 。 

.将 下 列 的 十 六 进 制 数 转换 成 十 进 制 数 ; 

(a) 0xFES7 = 65 111 

(b) OxA3011 = 667 665 

(c) OxDEO01 = 56 833 

(d) 0x3AB2 = 15 026 

.每 秒 7.64 微 英尺 ， 即 每 秒 7.64 x 10-? 英 尺 。 


第 2 章 奇数 号 习题 答案 


1. 与 电路 变 成 或 电路 ， 而 或 电路 变 成 与 电路 。 
3. 


ULD 


~ Cn 


\D 
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5. 真 值 表 如 图 所 示 : 





7. 电路 如 图 所 示 ; 


b 


第 3 章 奇 数 号 习题 答案 
1. 真 值 表 和 卡 诺 图 如 下 图 所 示 ; 


erp 





SUM 的 卡 诺 图 Cout 的 卡 诺 图 
*AxB *AB AB Ax*B *A*B *AB AB Ax*B 





SUM = A*B*Cin+t A*B*Cin+ A*B*+Cint+ A*B*Cin 
SUM = Cin*(A*B+A*B)+Cin*(A*B+A*B) 
注意 到 公式 A4*B+A*B 正 好 表示 的 是 异 或 门 (XOR)， 我 们 可 以 对 第 二 项 进行 简化 。 此 
外 ， 第 一 项 A*B+A*B 正 好 是 异 或 函数 的 补 ， 所 以 实际 上 是 两 个 幅 套 的 XOR 项 : 
SUM = Cin®[A®B] 
我 们 可 以 用 卡 诺 图 来 简化 Cout 的 逻辑 ， 一 共有 三 个 圈 ， 对 应 的 表达 式 为 ; 





Cout = B*Cin + A*Cin + A*B 


下 面 是 SUM 和 Cout 的 逻辑 电路 实现 。 
AB Cin 








3. 假设 T = 0 时 逻辑 电 平 由 0 变 为 1， 如 下 图 所 示 。 我 们 可 以 看 到 ， 传 递 这 个 信和 号 的 变化 经 过 一 
个 门 就 增加 10ns 的 延迟 。 当 经 过 50ns 后 信号 到 达 A 点 ,， 它 将 相反 极 性 的 信号 输入 到 第 一 个 门 ， 
后 续 的 信号 序列 的 极 性 将 完全 相反 。 在 T = 100ns 的 时 刻 ， 情 况 与 T = 0 时 完全 相同 ， 只 是 过 
去 了 100ns 的 时 间 。 所 以 ， 电 路 以 100ns 的 周期 震荡 ， 点 A 处 信号 的 频率 是 10MHz。 


A 点 波形 


从 A 点 处 看 到 的 波形 为 : 
5. 真 值 表 和 卡 诺 图 如 下 所 示 ， 
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被 简化 的 方程 为 : 


X=A*B*+D+C*D 
Y=C*D+B*D=D*(C+B) 
Z=D 


7. 让 我 们 看 一 看 解决 方案 的 逻辑 。 有 关 和 泵 的 马达 的 设计 人 逻辑 可 以 是 ， 当 温度 太 低 时 ， 和 泵 不 会 
自动 开启 马达 和 加 热 器 。 另 一 种 可 能 的 理解 是 ， 当 温度 很 低 时 马达 和 加 热 器 会 自动 开启 。 
泵 的 控制 电路 应 该 体现 这 两 种 选择 。 


a. 泵 的 马达 ， 当 计时 器 (B) 开启 ， 或 者 手动 开关 (F) E 
开启 并 且 钥 匙 开关 (E) 打开 时 ， 泵 的 马达 打开 (f=1)。 B 各 f 
注意 在 另 一 种 解决 方案 里 温度 变 低 也 能 使 泵 开启 ， 因 此 我 F 


们 在 电路 中 加 了 一 项 考虑 这 个 情况 。 解决 方案 
b. 加 热 器 ， 当 温度 传感器 (A) 指示 水 温 低 于 控制 面板 上 设 定 的 温度 时 ， 加 热 器 应 该 打 
开 (h = 1)。 我 们 还 有 更 实际 的 考虑 ， 就 是 除非 奈 也 打开 了 ， 和 否则 加 热 器 就 不 用 开 。 如 果 加 


热 水 时 水 不 流动 是 很 危险 的 。 这 个 设计 体 E 
现在 加 热 器 h 的 控制 电路 图 中 。 A i> > 四 ! 
这 样 ， 在 上 面 的 电路 中 必须 具备 三 个 F 一 


条 件 才能 使 加 热 器 打开 ， 另 一 种 解决 方案 
1. 钥匙 开关 (E) 打开 。 
2. 泵 打开 (B+F)。 
3. 温 度 低 (A )。 





解决 方案 


按 另 一 种 解决 方案 能 得 到 更 简单 的 安排 。 要 打开 加 热 器 仅 需 要 钥匙 开关 和 低温 这 两 个 
条 件 。 我 们 不 必 担 心 泵 ， 因 为 A 为 真 时 它 就 打开 了 。 


E 
AND h 
— 
- 另 一 种 解决 方案 


c. 吹风 机 : 空气 吹风 机 (g) 的 控制 很 简单 ， 钥 匙 开关 必须 开 〈(E = 1)， 同 时 吹风 机 开 
关 也 必须 开 (D = 1)， 这样 就 能 在 完成 家 庭 作业 辛 苗 了 一 天 后 享受 温柔 的 气泡 和 暖 风 。 这 
个 控制 电路 如 下 所 示 : 


AND 9 
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9. 电路 如 下 图 所 示 : 


第 4 章 奇 数 号 习题 答案 
1. 下 面 是 状态 迁移 图 : 


(Ce 
Co 


时 钟 脉冲 Qa Qb 


时 钟 脉 冲 到 来 前 

第 1 个 时 钟 脉 冲 后 
第 2 个 时 钟 脉冲 后 
第 3 个 时 钟 耿 冲 后 
第 4 个 时 钟 脉冲 后 


3. 真 值 表 为 : 


OO ~ OO 
OP ~ OS 





5. 表格 如 下 所 示 ， 经 过 6 个 时 钟 脉 冲 后 工作 模式 发 生 重复 。 
脉冲 到 来 前 脉冲 到 来 后 
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7. 同步 计数 电路 如 下 所 示 : 





第 5 章 奇 数 号 习题 答案 
1. 真 值 表 和 状态 图 如 下 所 示 ， 
Ain Bin 之 Aout Bout 

0 0 0 0 1 
1 0 0 0 0 
0 0 1 1 
1 1 0 1 0 
0 0 1 1 0 
了 0 1 0 1 
0 1 1 1 1 
1 1 1 0 0 








5. 有 S0 到 $3 四 个 状态 ， 所 以 需要 X 和 Y 两 个 变量 ， 提供 到 寄存 器 的 输出 和 两 个 真 值 表 的 输入 。 
这 样 ， 我 们 就 可 做 如 下 断言 : 
S0 一 X=0,Y=0 
S1 一 X=1Y=0 
S2—X=0,Y=1 
S4—X=1,Y=1 
让 我 们 首先 按 字 分 析 该 系统 ， 可 从 填写 真 值 表 开始 。 假设 系统 处 于 S0 且 没有 投 人 钱 ， 
系统 就 处 在 此 状态 ， 我 们 就 可 用 下 面 的 表 项 来 描述 : 


a b x y X Y Z 


0 0 0 0 0 0 0 


现在 ,假设 我 们 处 于 状态 S0 (SO0 一 X=0, Y=0)， 则 可 能 性 有 : 
1. 无 钱 投入 ， 仍 停留 在 S0。 

2. 投入 1 角 钱 (a=0,b=1)， 迁 移 到 状态 S1。 

3. 投入 四 分 之 一 美元 (a=1, b=0)， 迁 移 到 状态 S3。 


我 们 可 将 这 个 条 件 表示 如 下 : 
a b x y X Y Zz 
0 0 0 0 0 0 
1 0 0 1 0 0 
0 0 0 1 1 0 





现在 ,假设 我 们 处 于 状态 S1 (S1 一 X=1, Y=0)， 则 可 能 性 有 : 
1. 无 钱 投入 ， 仍 停留 在 S1。 

2. 投入 1 角 钱 ， 迁 移 到 状态 S2。 

3. 投入 四 分 之 一 美元 ， 返 回 到 状态 SO0， 并 交付 商品 。 

我 们 可 将 这 表示 为 如 下 的 条 件 : 





© 
一 
性 
OO Oi< 
© 
一 
[es 
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现在 ， 假 设 我 们 处 于 状态 S2 〈S2 一 X=0, Y=1)， 则 可 能 性 有 : 
1. 无 钱 投入 ， 仍 停留 在 S2。 

2. 投入 1 角 钱 ， 迁移 到 状态 S0， 并 交付 商品 。 

3. 投入 四 分 之 一 美元 ， 返 回 到 状态 S0， 并 交付 商品 。 

我 们 可 将 这 表示 为 如 下 的 条 件 : 





a b x y xX Y 乙 
0 0 0 1 0 1 0 
1 0 1 0 0 

0 0 1 0 0 1 





现在 ,假设 我 们 处 于 状态 S3 (S3 一 X=1, Y=1)， 则 可 能 性 有 : 
1. 无 钱 投入 ， 仍 停留 在 S3。 

2. 投入 1 角 钱 ， 寺 移 到 状态 S0， 并 交付 商品 。 

3. 投入 四 分 之 一 美元 ， 返 回 到 状态 S0， 并 交付 商品 。 

我 们 可 将 这 表示 为 如 下 的 条 件 : 








a b x y X Y Z 
0 0 1 1 1 1 0 
0 1 1 1 0 1 
1 0 1 1 0 0 1 





这 样 我 们 就 考虑 了 所 有 的 可 能 性 。 现 在 就 用 这 些 已 知 的 情况 填写 真 值 表 : 








a b x y X Y Zz 
S0 0 0 0 0 0 0 0 
S0 0 1 0 0 1 0 0 
SO0 1 0 0 0 1 1 0 
S0 1 1 0 0 X -x x 
S1 0 0 1 0 1 0 0 
S1 0 1 1 0 0 1 0 
sl 1 0 1 0 0 0 1 
Sl 1 1 1 0 x x x 
S2 0 0 0 1 0 1 0 
S2 0 1 0 1 0 0 1 
S2 1 0 0 1 0 0 1 
S2 1 1 0 1 x x x 
S3 0 0 1 1 1 1 0 
S3 0 1 1 1 0 0 1 
S3 1 0 1 1 0 0 1 
S3 1 1 1 1 x x x 





Xx 表示“ 无 关 条 件 "。 它 们 在 实际 操作 中 永远 不 会 发 生 ， 所 以 我 们 将 它们 保留 下 来 看 看 
是 否 能 帮助 我 们 化 简 电 路 的 K 图 。 
状态 变量 X 的 K 图 如 下 所 示 : 
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a*b a*b a*b 


1 
其 
Tl 


我 加 入 了 灰色 的 项 (a*b* xz* 》 ) ， 因 为 它 将 方程 化 简 了 一 位 ; 
X= kx 二 by 坟 + 了 + 


状态 变量 Y 的 K 图 显示 如 下 : 


ak a*b a*b a*b 
ty 1 1 
X*y 1 
X*y 1 
xX*y 1 1 





Y=a*Xx*y+ a* bx*y+b*x*y 


最 后 ， 输 出 变量 Z 的 K 图 显示 如 下 : 








a*b a*b a*b a*b 
xX*y 
x*y 1 1 1 
XYy 1 1 1 
x*y 1 1 





Z=b*yt+a*y 十 a*x* y 


门 级 的 图 显示 如 下 : 





7.RESET 过 后 ， 所 有 输出 都 是 0， 这 就 保证 了 机 器 从 一 个 已 知 状态 开始 运行 。 在 每 个 时 钟 脉 冲 
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后 ， 系 统 的 状态 显示 在 如 下 的 表 中 : 


时 钟 RESET 1 2 3 4 5 6 7 8 9 10 11 12 13 14 


输出 0000 1100 1011 1000 1001 0001 0100 1110 0010 0Q101 0110 0111l 1t11l 1010 0000 


这 样 ，14 个 时 钟 脉冲 后 状态 开始 重复 。 





第 6 章 奇 数 号 习题 答案 
1. 门 设计 如 下 所 示 。 注 意 这 很 像 一 个 从 负 逻 辑 转换 成 正 逻 辑 的 问题 。 


A B 


3a. 由 于 存储 器 宽 是 32 位 ， 我 们 需要 4 个 存储 器 芯片 来 形成 一 个 32 位 的 页 。 我 们 有 总 共 2* 个 地 
址 位 。 每 个 页 是 512K， 需 要 2 "条 地 址 线 。 这 样 ，22-28=2 ， 我 们 有 128 页 存储 器 。 由 于 
每 页 需要 4 个 器 件 ， 我 们 就 需要 总 共 512 个 存储 器 芯片 。 


3b. 
页 号 起 始 地 址 (hex) 结束 地 址 (hex) 
0 0000000 007FFFF 
1 0080000 OOFFFFF 


2 0100000 OQ17FFFF 





5a. 直接 存储 器 访问 ; 一 种 提高 在 外 部 设备 和 计算 机 存储 器 之 间 数 据 传输 效率 的 方法 。DMA 


Sb. 


5 


7 


7 
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过 程 允 许 外 部 设备 在 处 理 器 空闲 时 掌握 对 存储 器 总 线 的 控制 ， 外 设 绕 开 处 理 器 ， 直 接 处 理 
对 存储 器 的 数据 传输 。 


三 态 逻 辑 ， 一 种 电路 设计 ， 在 存储 器 或 其 他 器 件 上 加 入 额外 的 输出 控制 ， 使 得 其 输出 在 总 


线 上 捆绑 在 一 起 。 当 三 态 逻辑 关闭 器 件 的 输出 时 ， 输 出 对 总 线 呈 现 出 高 阻抗 。 换 名 话说， 


就 好 像 它 没有 连接 到 总 线 ， 这 就 使 另 一 个 输出 能 驱动 总 线 。 
.地 址 总 线 、 数 据 总 线 、 状 态 总 线 : 这 些 是 处 理 器 的 三 个 主要 的 总 线 。 地 址 总 线 为 存储 系统 
提供 下 一 个 存储 器 操作 的 地 址 ， 它 是 单 向 的 ， 所 有 信号 都 是 从 处 理 器 向 存储 器 输出 。 数 据 


总 线 是 双向 的 ， 数 据 流 在 同一 总 线 上 流入 到 处 理 器 和 流出 到 存储 器 。 状 态 总 线 是 异 质 的 ， 


一 些 信号 只 是 输入 ， 一 些 信 号 只 是 输出 ， 其 他 是 双向 的 。 状 态 总 线 携带 了 处 理 器 的 所 有 事 





务 处 理 信 号 。 
存储 器 译 码 电路 显示 如 下 : 
. 网 表 显 示 如 下 : 

线 网 名 

addr0 U1-36 
addrl U1-35 
addr2 U1-34 
addr3 U1-33 
addr4 U1-32 
addr5 Ul-31 
addr6 U1-30 
addr7 U1-29 
addr8 U1-28 
addr9 U1-27 
addr10 U1-26 
addrl1l U1-25 
addr12 U1-24 
addr13 U1-23 
addr14 Ul-22 
addr15 Ul-21 
data0 U1-1 
datal U1-2 


U6 存储 器 译 码 电路 “CHIP” 


U4-1 
U4-2 
U4-3 
U4-4 
U4-5 
U4-6 
U4-7 
U4-8 
U4-9 
U4-10 
U4-11 


U4-12 


U4-13 
U4-14 


U5-1 
US-2 
U5-3 
U5-4 
US-5 
U5-6 
U5-7 
US-8 
U5-9 
U5-10 
US-11 
U5-12 
US-13 
US-14 
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( 续 ) 
线 网 名 
data2 U1-3 U2-17 U4-17 
data3 U1-4 U2-18 U4-18 
data4 U1-5 U2-19 U4-19 
data5 U1-6 U2-20 U4-20 
data6 U1i-7 U2-21 U4-21 
data7 Ul1-8 U2-22 U4-22 
data8 U1-9 U3-15 US-15 
data9 U1-13 U3-16 US-16 
datal0 U1-14 U3-17 US-17 
datall U1-15 U3-18 US-18 
datal2 U1-16 U3-19 US-19 
datal3 U1-17 U3-20 US-20 
datal4 U1-18 U3-21 US-21 
datal5 U1-19 U3-22 US-22 
ADVAL U1-12 U6-3 
WR U1-10 U2-23 U3-23 
RD U1-11 U2-24 U3-24 U4-24 U5-24 
CSROM U6-5 U4-25 US-25. 
CSRAM U6-7 U2-25 U3-25 
第 7 章 奇数 号 习题 答案 


1. 大 小 不 必 一 定 匹 配 。 有 很 多 事例 显示 出 内 部 存储 器 总 线 有 的 比 外 部 总 线 小 ， 有 的 大 。 例 如 ， 

现代 PC 有 64 位 宽 的 外 部 存储 器 总 线 ， 但 目前 的 Athlon 和 奔腾 处 理 器 有 32 位 宽 内 部 总 线 。 
在 对 成 本 敏感 的 系统 中 ， 为 了 使 设计 者 能 够 建立 一 个 更 经 济 的 系统 ， 外 部 总 线 可 能 要 

比 内 部 数据 总 线 窗 。 然 而 ， 窜 的 存储 器 宽度 意味 着 必须 进行 更 多 次 的 存储 器 取 数 操作 ， 总 
体 性 能 将 会 下 降 。 

3a. MOVE.W $1000, A3; 你 必须 使 用 MOVEA.W 来 装 入 一 个 地 址 寄存 器 。 

3b. ADD.B D0,#$A369: 目的 操作 数 不 能 是 一 个 文字 。 

3c. ORI.W #$55AA007C, D4: 操作 的 尺寸 在 本 例 中 是 字 ， 它 必须 与 文字 源 操作 数 的 大 小 匹配 。 

3d. MOVEA.L D6, A8: 没有 地 址 寄存 器 A8。 

3e. MOVE.L $1200F7, D3: 这 是 一 个 非 对 齐 访问 错误 。 对 于 一 个 字 或 长 字 ， 访问 源 地 址 或 目 
的 地 址 必须 在 一 个 偶数 字 地 址 边界 上 。 

5.$AA。 

7a. MOVE.L D0,D7 这 是 合法 的 。 

7b. MOVE.B D2,#$4A ”非法 : 不 能 将 一 个 值 存储 到 一 个 文字 中 。 

7c. MOVEA.B D3,A4 非法 : 不 能 将 一 个 地 址 作为 一 个 字 节 存储 。 

7d. MOVE.W A6,D8 非法 : D8 不 是 一 个 有 效 的 寄存 器 。 

7e. AND.L $4000, $55AA 非法 : AND 操 作 的 源 操 作 数 和 目的 操作 数 中 至 少 有 一 个 必须 是 
数据 寄存 器 。 

9. XOR 指 令 的 逻辑 操作 就 是 按 位 做 “ 异 或 "， 这 样 ， 任 何 一 对 的 位 ， 车 侈 为 1 则 结果 为 0， 若 一 
个 为 1 一 个 为 0， 则 结果 为 1。 字 FFFF 的 效果 是 使 字 AAAA 成 为 5555 的 补 ， 将 其 加 1 就 得 5556。 
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FFFF XOR AAAA =5555 + 1 = 5556 
11. <004000> = $4515 
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次 突 大 次 风 灾 灾 灾 册 由 六 灾 灾 实 突 大 大 认 类 次 次 文 南 关 炎 闪闪 次 灾 太 六 大 突 闪 风灾 商 六 大 六 内 风 内 交 页 大大 突 灾 次 突 商 交 交 交 关 淡 次 育 雇 类 和 
大 


* 子 程序 定时 器 : 


* 该 子 程序 从 1 到 9 之 间 的 一 个 数 开 始 倒计时 ， 这 个 数 由 寄存 器 D0.B 传 入 。 

* 倒计时 的 速率 是 每 两 秒 钟 一 个 数字 ， 使 用 一 个 定位 在 地 址 $00001002 的 500ms 硬 件 
”定时 器 。 

* 7 段 码 显示 器 定位 在 地 址 $00001000 

* 程序 中 不 进行 任何 错误 检查 

* 所 有 寄存 器 都 在 退出 时 恢复 


* All registers used are save upon exit. 
次 灾 大 次 次 灾 和 认 大 大 灾 灾 突 夫 交 太 次 内 实 交火 突 突 灾 突 商 太 灾 次 识 裕 兴 大 宙 灾 突 容 让 六 灾 次 灾 让 次 央 六 关内 雇 商 关 灾 次 宙 太 交 丰 次 光 突 大 妆 





disp0 EQU $3F * 显示 的 位 码 
displ EQU $06 
disp2 EQU $5B 
disp3 EQU $4F 
disp4 EQU $56 
disp5 EQU $6D 
disp6 EQU $7D 
disp7 EQU $07 
aisp8 EQU $7F 
disp9 EQU $67 、， _ 
trigger EQU $10 “ 这 用 来 启动 定时 器 
time_out EQU $01 * 这 用 来 测试 是 否 完成 
display EQU $00001000 * 显示 器 的 存储 位 置 
delay EQU $00001002 * 定时 器 硬件 的 存储 位 置 
* 代码 从 这 里 开始 
timer MOVEM.L A0/Al1/D1/D2/D3,-(SP) * 在 入 口 处 保存 寄存 器 
entry 
LEA patterns,A0 * A0 指 向 显示 码 
display 
MOVEA.L #display,Al * Al 指向 显示 器 
MOVEA.L #delay, A2 * A2 指 向 时 延 电路 
circuit 
CLR.L D1 * Dl 是 变 址 寄存 器 
MOVE.B DO,D1 * 得 到 变 址 值 
loopl MOVE .B 00(A0,D1), (A1) * 发 送 码 到 显示 器 
CMPI.B #00,D1 * 是 否 已 经 D1 = 0? 
BEQ return * 是 的 ， 返 回 
MOVE .B #4，D2 * 建立 反 计时 定时 器 
loop2 MOVE.B #trigger, (A2) * 定时 器 开始 
loop3 MOVE.B (A2) ,D3 * 得 到 状态 
ANDI.B #time_out, D3 * 孤立 出 DB0 
BEQ loop3 * 保持 等 待 
SUBQ.B #1,D2 * 递减 D2 
BNE loop2 * 返回 
SUBQ #1 ,D1 * 指向 下 一 个 码 
BRA loopl 
return MOVEM.L (SP)+,D3/D2/D1/A1/A0 * 恢复 寄存 器 
RTS 
patterns DC.B 


disp0,displ,disp2,disp3,disp4,disp5,disp6,disp7,disp8, disp9 
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3.<DO> = $0000002A 
5. ROM 是 只 读 设备 。 最 后 一 条 指令 MOVE.W D0, (A2) 将 对 ROM 进 行 一 次 写 操作 。 这 是 不 正 


确 的 。 
7. 
delay equ 2000 * 2 秒 延 迟 
mask equ $8000 * 定时 器 状态 
bits equ 01 * 位 码 
io_port equ $4000 * I/0 端 口 的 位 置 
timer equ $8000 * 定时 器 端口 
org $400 
start move.b #bits,io port * 和 载 作 IO 端口 
loop move.w #delay,timer * 载 人 定时 器 
move.b io_port,a0 * 得 到 端口 
rol.b #bits,Q0 * 左 移 
move.b d0, io_port * 送 回 
move.w #delay, timer * 设置 时 延 
wait andi.w #mask, timer * 检查 状态 
beq wait * 非 零 ， 保 持 等 待 
bra loop * 重 做 
end $400 
9. 


党 守 训 寅 半袖 识 宫 寅 二 宙 客 丰 去 灾 襄 击 容 方志 汪 窒 广 丙 调 山 潜 宾 埋 识 容 广 页 商 实 商 站 将 次 商 测 油 油 省 座次 次 窑 次 识 兴 容 容 内 克 诉 宾 窒 光 高 
次 


* 这 是 一 个 将 存储 器 用 字 码 $5555 填 充 的 程序 
友 
实 灾 兴安 肉 册 突 内 究 商 汪 内 妆容 妆 实 丰 丰 站 站 灾 家 厂 妆 实 实数 安安 让 克 祷 实 实 商 宙 安 安 妆 实 究 廊 认 安室 座 涌 兴 妆 有 家 安 疫 关 兴 各 妆 生 内 


OPT CRE 
fill_st EQU $00002000 * 填充 块 的 开始 
fill end EQU $000020FF * 填充 的 最 后 地 址 
pattern EQU $5555 * 填充 码 
start EQU $400 * 程序 从 这 里 开始 
ORG start 
LEA fill_st,AO * 装载 开始 地 址 
LEA fill1_end,Al * 装载 结束 地 址 
MOVE.W #pattern,D0 * 装载 将 要 写 的 字 码 
loop MOVE.W DO, (A0)+ * 移动 它 并 递增 指针 值 
CMPA.L Al,A0 * 我 们 是 否 已 完成 
BLE loop * 没有 ? 返回 并 重复 
STOP #$2700 * 跳 回 到 模拟 器 
END start 
第 9 章 奇 数 号 习题 答案 


1. 这 是 一 个 “ 带 变 址 和 位 移 的 寄存 器 间接 寻 址 ”的 例子 。 有 效 地 址 是 A0 中 的 地 址 值 、 变 址 值 
D0 以 及 位 移 的 2 补 码 三 者 之 和 。 由 于 $84 是 一 个 负数 〈-7C) ， 所 以 ， 有 效 地 址 EA = $2000 + 
$0400 + (-$7C)。 

EA = $2384 
该 程序 不 可 重 定位 ， 原因 有 二 : 
1. 有 一 个 到 绝对 地 址 start 的 跳 转 。 
2. 绝对 地 址 装 入 了 A0。 通 过 控制 对 A0 和 D0 的 装 入 值 ， 程 序 仍 可 以 是 可 重 定位 的 ， 但 
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跳 转 指令 强制 使 之 成 为 了 绝对 地 址 。 
3. 突出 显示 的 指令 执行 后 ，D0 中 的 值 是 $0000002A。 


00000400 067955550000AAAA ADDI .W #$5555, $0000AAAA 


00000408 06B9AAAAS55550000FFPFE ADDI.L #$SAAAAS5S5S55, $0000FFPE 
00000412 0640AAAA ADDI.W #$AAAA, DO 


次 次 次 妆 六 交 六 克 克 太太 类 交 灾 类 容 风 类 灾 类 次 交 交 六 交火 次 太太 克 六 次 交火 灾 容 风灾 次 炊 火 大 六 砍 妆 记 六 交大 让 次 六 实 交 灾 究 风灾 风灾 实 风 风 炎 交友 太 丸 


大 


* 可 重 定位 的 存储 器 检测 程序 


交 六 交 交 克 六 六 六 次 灾 训 凡 内 坎 淡 次 灾 炎 火灾 交大 类 奖 火 交 立交 六 大 交 六 交 交 大 六 六 六 交 六 次 六 克 次 六 页 尖 克 闹 宙 资 六 次 突 交 灾 灾 裕 突 风灾 灾 交 灾 宙 次 次 风 


* 系统 的 等 于 伪 指 令 


patternl EQU SAAAA * 第 一 个 测试 码 
pattern?2 EQU SFFFF * 第 二 个 测试 码 
pattern3 EQU $0001 * 第 三 个 测试 码 
st_addr EQU $00000400 * 测试 的 起 始 地 址 
end_addr EQU $0009FFFO * 测试 的 结束 地 址 
stack EQU $000C0000 * 堆栈 指针 的 位 置 
word EQU 2 * 字 的 长 度 ， 即 字 节 数 
byte EQU 1 * 一 个 字 节 长 ， 不 是 什么 神秘 的 数 ! 
bit EQU 1 * 移 位 
exit_pgm EQU $2700 * 模拟 器 退出 码 
data EQU $500 * 数据 存储 区 域 
start EQU $400 * 程序 从 这 里 开始 
new_ad EQU $000A0000 * 重 定位 程序 从 这 里 运行 
pr_cma EQU 00 * 打印 消息 命令 
* 主 程序 
OPT CRE * 打开 交叉 引用 
ORG start * 程序 从 这 里 开始 
LEA stack, SP * 初始 化 堆栈 指针 
LEA relo,A0 * 起 始 地 址 指针 
LEA last_addr,Al * 结束 指针 
LEA new_ad, A3 * 目的 
relo_lp MOVE.W (A0)+,(A3})+ * 移动 一 个 字 
CMPA.L AO0,Al * 移动 足够 了 吗 ? 
BPL relo_lp 
JMP new_ad 
relo LEA test_patt (PC) ,A3 * A3 指 向 使 用 的 测试 码 
LEA bad_cnt (PC) ,A4 ”* A4 指 向 坏 的 存储 计数 器 
LEA bad_adqr (PC) ,A5 * A5 指 向 坏 的 地 址 位 置 
LEA data_read (PC) ,A6 * A6 指 向 数据 存储 区 
CLR.B (A4) * 坏 地 址 计数 器 清 震 
MOVE.W (A3)+,D0 * 获得 当前 测试 码 ， 并 指向 下 一 个 
One 
BSR do_test * 运行 第 一 个 测试 
NOT.W DO * 对 位 求 反 用 于 第 二 个 测试 
BSR do_test * 运行 第 二 个 测试 
MOVE.W (A3)+,D0O * 获得 下 一 个 测试 码 
BSR do. test * 运行 第 三 个 测试 
NOT.W DO * 对 位 求 反 用 于 第 四 个 测试 
MOVE.W (A3) ,DO * 获得 最 后 一 个 测试 码 
shiftl1 BSR do_test * 运行 移 位 测试 
ROL.W  #bit,D0 * 移 位 的 位 数 
BCC shift1 * 做 完了 吗 ? 没有 的 话 返 回来 
MOVE.W -(A3),D0 * 再 一 次 获得 测试 码 3 
NOT.W DO * 对 测试 码 3 求 反 
shift2 BSR Go_test * 运行 这 个 测试 
ROL.W  #bit,p0 * 移动 这 些 位 
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BCS shift2 * 做 完了 吗 ? 没有 的 话 返 回来 
message MOVE.B #pr_cmd,D0O * 装 入 指令 来 打印 标语 

LEA string (PC),AL * 指向 消息 

MOVE.W str_len(PC),D1 

TRAP #15 * 开始 做 
done STOP #exit_pgm * 退出 回 和 到 模拟 器 


交 突 闪 交 突 灾 去 次 交友 克 炎 交 丰 实 妆 克 克 灾 大 究 灾 六 站 家 克 交 究 砍 赤 灾 由 六 灾 梁 交 六 容 直 太 闪 次 太太 站 次 大 灾 克 不 灾 丰 太 灾 灾 上 丰 均 灾 宙 亦 交 究 志 次 究 灾 克 交 灾 广 六 大 


* 子 程序 : do_test 


* 执行 实际 的 存储 器 测试 。 用 感 兴趣 的 测试 码 填充 存储 器 。 
* 使 用 的 寄存 器 : D1、A0、Al、 A2 


* 返回 值 : 无 

* 保存 的 寄存 器 : 无 

* 输入 参数 ， 

* D0.W = 测试 码 

* A4.L = 指向 保存 了 坏 地 址 数 的 存储 器 位 置 

* R5.L = 指向 保存 了 最 后 一 个 被 发 现 的 坏 地 址 的 存储 器 位 置 


* A6.L 


指向 保存 了 数据 读 回 和 数据 写 入 的 存储 器 的 位 置 
* 假设 : 保存 了 所 有 内 部 使 用 的 寄存 器 


灾 交 太 次 灾 太 大 央 炊 交大 内 次 六 妆 容 实 太 交 内 类 交 交 突 次 详 容 次 克 实 关 交 让 炎炎 六 六 次 次 六 灾 炎 区 次 大肉 凡 丰 灾 交 不 妆容 次 六 灾 内 次 六 交 实 太太 次 实 太 商 大 灾 炎 六 


do_test MOVEM.L A0-A2/D1,- (SP)* 保存 寄存 器 
LEA st_addr,A0 * A0 指 向 起 始 地 址 
LEA end_addr,Al * Al 指 向 最 后 地 址 
MOVE.L AO0,A2 * 填充 A2， 将 指向 存储 器 
fill_loop MOVE.W D0, (A2)+ * 填充 和 指针 递增 
CMPA.L Al,A2 * 做 完了 吗 ? 
BLE fill_loop 
MOVE.L AO0,A2 * 指针 复位 
test_1oop MOVE.W (A2),D1 * 从 存储 器 中 读 回 值 
CMP.W D0,D1 * 它们 相同 吗 ? 
BEQ addr_ok * 好 ， 检 验 下 一 个 位 置 
not_ok MOVE.L AO, (A5) * 保存 坏 位 置 的 地 址 
tion 
ADDQ.W #byte, (A4) * 计数 器 递增 
MOVE.W ~ D1, (A6)+ * 保存 读 回 的 数 
MOVE.W D0, (A6) * 保存 写 入 的 数 
SUBQ.L #word, A6 * 将 A6 恢 复 为 指针 
addr._ok ADDQ.L #word, A2 * A2 指 向 下 一 个 存储 器 位 置 
CMPA.L Al,A2 * 我 们 到 达 最 后 一 个 地 址 了 吗 ? 
BLE test_loop * 没有 ， 继 续 测 试 
MOVEM.L (SP)+,D1/AO-A2* 恢复 寄存 器 
RTS * 返回 
* 数据 空间 
test_patt DC.W patternl,pattern2,pattern3 * 存储 器 测试 码 
bad_cnt DS.W 1 * 跟踪 坏 地 址 
bad_ addr DS.L1 * 在 这 里 存储 发 现 的 最 后 一 个 坏 地 址 
data_read DS.W 1 * 我 读 回 的 是 什么 ? 
data wrt DS.W 1 * 我 写 了 什么 ? 
string DC.B ‘End of test’ * 退出 消息 
str_len DC.W str_len-string 
last_ addr DS.W 1 
END start 
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1. <0C0020h> = 1SC7h， 该 字 是 对 齐 的 。 
3.0F57Ch 
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MOV CX,4 
MOV BX,10 


loopl: 
inc BX 
dec Cx 
.jnz loopl 


<AX> = OAF3DH 


MOV AX,8200H ; 得 到 段 值 

MOV DX,AX ; 装载 段 寄 存 器 

MOV SI,0000 装载 源 变 址 寄存 器 
MOV DI,0200H 装载 目的 变 址 寄存 器 
MOV CX,1000 装载 计数 器 


ws 


得 到 字 节 
存储 字 节 
指针 前 进 


MOV AL, {SI] 
MOV [DI],AL 
INC SI 

INC DI 

DEC CX 

JNZ loader 


DT 


~ 


第 11 章 奇数 号 习题 答案 


1 


ww 


.68K 有 两 种 操作 模式 ， 用 户 (user) 和 管理 (supervisor)。ARM 体 系 结构 允许 7 种 操作 模式 。 


用 户 模 式 是 优先 级 最 低 的 。 其 他 模式 为 系统、 管理 、 异 常 中 止 、 快 速 中 断 请 求 、 中 断 请 
求 和 未 定义 。 


.最 大 的 不 同 在 于 ， 除 了 寄存 器 r13-r15， 所 有 的 寄存 器 都 是 完全 通用 的 。 任 何 寄 存 器 都 可 以 


用 作 算 术 操 作 的 一 部 分 或 用 作 地 址 指针 ， 这 与 68K 体 系 结构 中 地 址 寄存 器 A0-A6 与 数据 寄存 
器 D0-D7 的 区 别 形成 了 鲜明 的 对 比 。 


.MOV r4, #&100 


ORR r4, r4, #3 


.<rll> = &0013E94C 
. 如 果 零 标志 = 0， 那 么 rl 的 值 &DEF02340 增 加 4 变 为 &DEF02344， 然 后 该 值 被 用 作 地 址 指针 


来 检索 存储 在 那个 存储 地 址 的 16 位 数据 对 象 ，16 位 值 然 后 被 载 人 通用 寄存 器 r4。 如 果 零 标 
志 = 1， 那 么 指令 不 被 执行 。 


第 12 章 奇数 号 习题 答案 


1 . 


到 文 广内 业 室 灾 灾 炎炎 灾 交 文 刘 广 文 广 支 文 太 文 文 灵 火灾 炎炎 容光 大 文 文 太 文 福 寞 二 宽容 炎炎 次席 容 守 光大 页 太太 码 灵 灾 灾 炎炎 灾 灾 去 灾 太 炎 克文 大 文 文 文大 灾 炎 


子 程 序 : xmitstr 
目的 : 将 一 串 字符 传送 到 UART 串 行 口 
输入 寄存 器 列表 : 
A6 一 指向 要 发 送 的 数据 串 的 指针 。 
返回 寄存 器 表 : 
A6 一 指向 字符 串 结束 字符 之 后 的 字符 的 指针 。 
寄存 器 用 法 : 所 有 xmitStzr 使 用 的 寄存 器 将 保存 起 来 ， 并 在 退出 后 恢复 。 


区 将 外 站 和 和 并 





寺 妆 导 习 题 从 类 377 
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* 假设 : 

* 一 至 少 有 一 个 字符 要 传送 。 

* 一 字符 串 以 SFF 结 束 。 

灾 凑 到 寺 潜 凌 裕 洪 雪 文 雪 炎 类 让 大 克文 码 大 克 灾 灾 赤 文 太 炎炎 炎炎 坟 直 天 实 灾 灾 丙 友 去 克 灾 火 兴 大 文 文 妈 灾 上 次 炎炎 太 实 炎炎 火 测 太太 文 文 文 灾 潜 炎 亚 广 翰 
* 数据 定义 

eom EQU SFF “消息 结束 字符 

status EQU $2001 “状态 寄存 器 

xmit EQU $2000 “传送 数据 寄存 器 

tbmt_mask EQU $01 * 隔 离 传 送 缓冲 器 


* 子 程序 从 这 里 开始 


xmitStr MOVEM.L DO/D1/A0/A1,- (SP) * 保 存 寄 存 器 
LEA.L xmit,AO *A0 指 向 传送 者 
LEA.L status,Al *Al 指 向 状态 寄存 器 
yxmit_loop MOVE.B (A1) ,D1 * 获 得 状态 
ANDI.B #tbmt_mask, D1 * 隔 离 位 
BEQ | mit_loop * 仍 然 忙 ， 保 持 等 待 
MOVE.B (AG6)+,D0 * 得 到 字 节 
CMPI.B #eom, DO * 是 最 后 一 个 字 节 ? 
BEQ quit * 是 ， 我 们 做 完了 
MOVE.B D0O, (AO) * 将 它 装 上 
BRA xmit_loop 《返回 江 
quit MOVEM.L (SP)+,D0/D1/A0/Al * 恢 复 寄 存 器 
RTS 


3. 逐步 逼近 总 是 用 相同 数量 的 时 钟 周期 来 数字 化 未 知 信号 。 由 于 它 是 16 位 分 辩 率 ， 就 需要 16 

个 时 钟 周 期 。 由 于 是 1MHz 时 钟 速率 ， 进 行 数字 化 就 需要 16ks。 
单 坡 AD 必须 计数 到 未 知 电 压 ， 因 此 ， 我 们 需要 确定 到 达 1.5001V 需 要 计数 多 少 次 。 然 而 ， 

我 们 可 容易 地 看 到 16 位 转换 器 的 范围 是 0 到 65 535 (十 六 进 制 30000 到 $FFFF) ， 所 以 ，A/D 转 
换 器 的 最 小 电压 增 量 是 00001V， 因 此 ， 需 要 15 001 个 时 钟 周期 或 15 001us 来 数字 化 未 知 电压 。 

5a. 一 个 11 位 的 2 补 码 数 可 表示 一 个 范围 在 - 1024 到 十 1023 的 数 ， 所 以 数字 值 变化 1 就 对 应 于 
0.010V。 任 何 更 小 的 电压 是 检测 不 出 来 的 。 

5b. 由 于 我 们 知道 每 个 数字 码 的 递增 代表 0.01V， 所 以 我 们 就 知道 十 5.11V 就 代表 511 (5.11V/0.01V 
=S$11)。 用 二 进 制 ，+ S$11 就 是 00011111111， 所 以 2 补 码 值 (一 5.11) 就 是 11100000001。 

5c. 8.96V 对 应 于 数字 值 896， 即 01110000000。 为 了 将 其 正确 地 表示 成 16 位 数字 ， 我 们 需要 在 
前 面 加 入 适当 数量 的 零 。 这 样 ， 结 果 就 是 0000 0011 0000， 即 0x0380。 

5d. 为 了 采用 逐步 逼近 方法 数字 化 一 个 11 位 的 值 ， 即 二 又 搜索 算法 的 硬件 类 比 ， 我 们 需要 
LOG227 即 11 个 样本 。 

5e. 由 于 我 们 在 时 钟 的 每 个 上 升 沿 取 一 个 样本 ， 而 且 我 们 需要 11 个 样本 ， 所 以 我 们 就 需要 11 个 
上 升 沿 。 时 钟 频率 是 LIMHz， 所 以 周期 就 是 lus。 这 样 ， 就 需要 11Ms 来 数字 化 该 模拟 信和 号 。 

7a.25us=40MHz 频 率 。 为 了 在 每 个 周期 采集 4 个 样本 ， 未 知 波形 的 最 大 频率 必须 不 能 大 于 10KHz。 

7b. 14 位 转换 =16 384 之 1。10V/16 384 = 0.0006V 

7c. 在 1ms 内 ， 它 下 降 1V。 在 2Sus， 它 下 降 .(25/1000)*1=0.025V。 由 于 这 比 转换 器 的 分 辨 率 
0.0006 大 得 多 ， 所 以 S/H 将 引起 重大 错误 。 因 此 ， 不 能 使 用 它 。 

9. 解答 : 
A.f 一 初始 化 硬件 
B.c 一 信任 检测 
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C. e 一 选择 通道 
D.g— S/H 

E. d 一 数字 化 

F. a 一 等 待 
G.b 一 取 数 据 

另 一 可 选择 的 解答 ， 
A.c 一 信任 检测 
B.f 一 初始 化 硬件 
C. e 一 选择 通道 
D. g— S/H 

E. d 一 数字 化 

F. a 一 等待 
G.b 一 取 数 据 
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1. 在 这 个 例子 中 ， 代 码 段 A 通过 流水 线 执行 的 效率 要 高 一 些 。 其 原因 在 于 A 中 的 各 个 指令 相对 
独立 ， 没 有 依赖 关系 。 而 在 代码 段 B 中 ， 必 须 一 条 指令 执行 完毕 后 ， 下 一 条 指令 才能 运行 。 
警 如 ， 只 有 指令 MOVE.W D1,D0 把 结果 放 入 D0 之 后 ADD.W 指 令 才能 开始 运行 。 同 样 ， 
ADD 指 令 完 成 之 前 ，MULU 指 令 也 不 能 执行 。 因 而 ， 在 流水 线 的 操作 中 ， 各 条 指令 必须 都 
必须 等 前 一 条 指令 完成 后 才能 执行 。 

3.a. 否 ， 因 为 它 包含 从 存储 器 到 存储 器 的 操作 。 

b. 是 ， 加 法 操作 发 生 在 两 个 寄存 器 之 间 。 

c. 是 ,这 里 的 MOVE 是 把 一 个 寄存 器 中 的 内 容 读 取 到 存储 器 中 的 存储 操作 。 
d. 否 ，AND 操 作 发 生 在 一 个 立即 数 和 一 个 存储 器 中 的 数 之 间 。 

e. 是 ， 该 操作 是 从 存储 器 中 把 数据 读 和 人 到 寄存 器 的 立即 装 入 操作 。 

5. 该 指令 序列 有 如 下 几 条 RISC 的 特征 。 最 重要 的 一 条 是 ADD 操 作 只 发 生 在 通用 寄存 器 之 间 。 
此 外 ， 序 列 中 没有 通过 直接 指定 存储 器 地 址 访问 的 寻 址 模式 ， 存 储 器 地 址 必须 先 装 入 寄存 
器 ， 然 后 该 寄存 器 作为 存储 器 的 指针 来 访问 。 因 而 我 们 只 看 到 了 两 种 寻 址 模式 。 

7a. 因为 该 流水 线 有 7 段 ， 每 段 需 要 2 个 时 钟 周期 ， 所 以 第 一 条 指令 下 流水 线 时 需要 14 个 时 钟 周 
期 。 因 为 每 个 时 钟 周期 为 10ns， 所 以 第 一 条 指令 执行 完毕 的 总 时 间 为 140ns。 

7b. 假设 没有 阻塞 ， 那 么 第 一 条 指令 执行 完毕 后 ， 剩 下 的 9 条 指令 将 依次 每 隔 2 个 时 钟 周 期 执行 
一 次 ， 即 需要 9 个 20ns， 总 共 180ns 来 完成 基本 模块 。 然 而 由 于 每 4 个 时 钟 周 期 流水 线 会 阴 
塞 两 次 ， 所 以 会 额外 增加 80ns 的 开销 (2x4x 10) ， 因 此 总 时 间 为 ， 

ET= 140ns+ 180ns+ 80ns = 400ns 
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1.a. 存储 器 的 层次 常常 被 表示 成 一 个 金字 塔 ， 顶 端 是 CPU。 它 表示 最 靠近 CPU 的 存储 器 ， 其 
访问 速度 最 快 ， 容 量 最 小 。 反 之 ， 离 CPU 越 远 ， 容 量 越 大 ， 速 度 越 慢 。 因 此 ， 存 储 器 的 访 
问 速 度 与 容量 成 反比 关系 。 而 且 ， 离 顶端 越 远 ， 单 个 位 的 成 本 也 越 低 。 

b. 空间 局 部 性 指 的 是 指令 和 数据 通常 是 成 堆 的 放 在 一 起 的 。 指 令 是 顺序 存储 ， 数 据 倾向 于 
成 组 存放 。 对 于 cache， 这 就 意味 着 如 果 指 令 和 数据 已 经 在 cache 中 了 ， 那 么 很 可 能 接 下 
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来 访问 的 指令 和 数据 也 在 cache 中 ， 因 此 ，cache 可 比 主 存 小 很 多 ， 但 仍然 很 高 效 。 

时 间 局 部 性 是 指 如 果 指 令 和 数据 最 近 被 访问 了 ， 那 么 它 很 可 能 在 不 和 久 的 将 来 会 被 再 次 
访问 。 因 此 ， 如 果 在 cache 中 的 内 容 最 近 被 访问 过 了 ， 那 么 它 很 可 能 还 会 被 访问 ， 这 样 就 提 
高 了 cache 的 效率 。 

c. 对 于 cache， 我 们 希望 尽 可 能 地 提高 命中 率 ， 降 低 不 中 惩罚 。 降 低 不 中 惩罚 的 一 种 方法 是 
每 次 发 生 cache 不 中 时 ， 采 用 突 发 方式 对 cache 的 一 部 分 而 不 只 是 一 个 字 进 行 重 填充 。 现 
代 的 SDRAM 存 储 器 都 被 设计 成 采用 突 发 数据 读 取 的 形式 来 重 填 充 片 上 cache， 从 而 极 大 
地 降低 了 重新 读 人 的 时 间 。 

d. 通 写 cache 在 将 数据 写 人 cache 的 同时 也 写 入 了 主 存储 器 。 这 样 就 避免 了 cache 与 主 存储 器 中 的 
数据 不 一 致 的 问题 ， 但 也 牺牲 了 一 部 分 性 能 。 回 写 cache 则 是 暂时 将 数据 放 在 cache 中 ， 等 到 
总 线 可 用 时 再 将 数据 写 入 到 主 存 储 器 。 虽 然 性 能 得 到 了 提高 ， 但 却 冒 着 存储 器 崩溃 的 危险 。 


.空间 局 部 性 可 以 从 如 下 三 个 方面 看 出 来 : 


a. 编译 后 的 指令 在 存储 器 中 只 占用 了 很 小 的 一 部 分 空间 ， 长 度 只 有 32 字 节 。 因 此 我 们 可 以 
假定 它们 存放 的 位 置 非常 靠近 。 

b. 由 于 数组 DataStream 里 的 变量 是 通过 对 指针 变量 解 引 用 ， 也 就 是 DataStream 加 上 一 个 偏 移 
值 count 来 进行 访问 的 ， 所 以 数组 里 的 各 个 元 素 在 主 存储 器 中 必须 是 顺序 存放 在 一 起 的 。 
c. 变量 count 和 maxcount 是 函数 main0) 的 局 部 变量 。 因 为 编译 器 在 系统 栈 上 创建 了 一 个 栈 空 
间 ， 大 小 足够 存放 2 个 整 型 变量 ， 所 以 它们 必须 被 放置 在 一 起 。 

时 间 局 部 性 可 以 从 如 下 一 些 方面 表现 出 来 ; 

a. 由 于 程序 的 主体 部 分 是 一 个 for 御 环 ， 所 以 循环 里 的 一 行 指令 被 执行 了 11 次 。 

b. 变 量 count 和 maxcount 被 重复 地 访问 ， 因 为 每 次 循环 count 都 会 递增 并 且 与 maxcount 相 比较 。 

c. 指针 变量 DataStream 不 断 地 被 解 引 用 ， 从 而 把 count 的 平方 放 入 连续 的 存储 位 置 。 

a. 主 存 的 地 址 范围 是 00000...FFFFF， 共 2” 个 地 址 ， 大 约 1MB。 如 果 每 个 重 充 线 
大 小 为 64B ， 即 24， 则 重 充 线 的 数量 为 22/25=24， 即 主 存储 器 中 有 16 384 个 重 充 线 。 

b. cache 存 储 器 的 容量 为 4096 个 字 节 。 采 用 与 上 面 a 中 同样 的 方法 ， 可 得 cache 中 有 212/25=24， 
共 64 个 重 充 线 。 

c. 由 于 这 是 一 个 直接 映像 cache， 所 以 cache 存 储 器 和 主 存储 器 中 重 充 线 的 行 数 相同 。 因 此 ， 
重 充 线 的 行 数 乘 以 列 数 = 16 384。 因 此 ， 重 充 线 的 列 数 = 16 384/64=22/246=28=256， 即 
主 存储 器 中 有 256 列 重 充 线 。 

d. 由 于 列 数 为 236， 所 以 标签 存储 器 中 必须 包含 8 位 才能 寻 址 256 列 中 的 任意 一 列 。 因 此 ， 标 
签 存储 器 的 地 址 需要 8 位 。 

e. 如 下 表 : 


cache RAM 地 址 = 00000 
相 下 签 \ 地 址 0003 





地 址 = 00FCo _\ 地 址 =00FFF 地 址 =FFFFF 
存储 器 中 字 节 地 址 = 列 地 址 + 行 地 址 x 64 + 字 节 偏 移 
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7. 有 效 执行 时 间 = 命 中 率 x 命中 访问 时 间 十 不 中 率 x 不 中 惩罚 
有 效 执行 时 间 =0.98 x 10+0.02 x 100 x 10= 9.8+20=29.8ns 

9. 当 处 理 器 开机 初始 化 的 时 候 ， 所 有 的 TLB 表 项 都 是 无 效 的 。 我 们 需要 通过 有 效 位 来 知道 一 
个 有 效 的 表 项 是 否 已 被 放 入 TLB ， 或 者 只 是 垃圾 。 
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1. 视频 游戏 者 在 对 CPU 进行 超频 以 从 机 器 榨取 最 后 一 点 性 能 这 方面 是 声名 狼 籍 的 。 因 为 超频 
会 产生 更 多 的 热量 ， 这 将 减 慢 内 部 过 程 ， 也 将 导致 处 理 器 在 接近 设计 极限 处 运行 。 液 体 冷 
却 在 排除 热量 方面 比较 有 效 ， 所 以 CPU 能 在 有 较 高 热 负 载 时 以 较 低 温度 运行 。 

. 对 于 计算 机 1: 

(1) 每 个 指令 在 一 个 时 钟 周期 内 执行 ， 即 1/100MHz = 10ns。 
(2) 它 必须 执行 总 共 1000 + 200 x 100 = 21000 条 指令 。 
(3) 总 执行 时 间 = 21000 x 10ns =2.1 x 104 乘 以 10 x 10-8 
=21x10-5=0.210x10-5=210us 
对 于 处 理 器 2: 
(1) 它 必须 执行 同样 的 21000 条 指令 ， 但 一 些 指令 比 其 他 指令 需要 两 倍 长 的 时 间 。 因 此 ， 
21000 条 指令 中 的 40% 执 行 一 个 时 钟 周 期 ，60% 执 行 两 个 时 钟 周期 。 
(2) 在 250MHz 下 ， 一 个 时 钟 周期 需要 4ns，2 个 时 钟 周 期 需要 8ns。 
(3) 因此 ， 总 执行 时 间 是 : 0.4 x 21000 x 4 x 10-9+0.6x21000 x8x10-9 
= (8.4 x 103) x (4 x 10-9) + (12.6 x 103) x (8 x 10-9) 
= (33.6x 10-6) + (100.8 x 1076) = 134.4 x 10-6 = 134.4us 
.每 条 指令 的 周期 数 x 每 个 时 钟 周 期 的 时 间 = 每 条 指令 的 时 间 
这 就 是 我 们 想 要 的 度量 . | 
计算 机 1 每 条 指令 需要 2 个 周期 且 每 个 时 钟 周期 占用 时 间 是 1ns (1/1GHz)， 所 以 ， 计 算 
机 1 执行 一 条 指令 需要 2ns。 
计算 机 2 每 条 指令 需要 1.2 个 周期 且 每 个 时 钟 周期 占用 时 间 是 2ns (1/500MHz)， 所 以 ， 
计算 机 2 执行 一 条 指令 需要 2.4ns，。 
这 样 ， 性 能 =2.4/2.0=1.2， 也 就 是 说 计算 机 1 具有 20% 更 好 的 性 能 。 
7. 分 析 这 个 问题 需要 我 们 考虑 指令 和 实际 加 法 操作 两 者 所 需要 的 访问 次 数 。 让 我 们 在 该 例子 
中 采用 68000 汇 编 语言 。 下 面 是 一 个 有 代表 性 的 代码 片段 : 
MOVE.L varl, DO *6 字 节 长 
ADD.L var?2, DO *6 字 节 长 
MOVE.L D0, var3. *6 字 节 长 . 
这 样 ， 加 法 操作 需要 18 个 字 节 从 存储 器 读 出 或 向 存储 器 写 和 人。8 位 宽 总 线 就 需要 18 次 存 
储 器 访问 ， 而 16 位 宽 总 线 就 需要 9 次 访问 ， 所 以 在 本 例 中 ， 还 必须 计 入 额外 的 9 次 访问 。 
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1. 熔 丝 图 显示 如 下 : 
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3. 像 这 样 的 具有 大 数量 级 数 的 电路 能 产生 长 序列 的 伪 随 机 数 。 如 果 存 在 有 缺陷 的 元 件 ， 那 么 
该 序列 数 将 会 快速 地 偏离 电路 完好 时 所 期 望 的 序列 。 在 某 种 意义 上 ， 这 是 一 个 好 的 杂凑 图 
数 的 硬件 类 比 物 。 因 此 ， 任 何 缺 陷 都 会 迅速 地 产生 与 标准 结果 截然 不 同 的 结果 。 
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ADDI (加 立即 数 ) ，232 
ADDQ (加 1 到 8 之 间 的 立即 数 ) ，232 
ADDX (加 X 值 )，232 
68K ， 
instructions (指令 )，238 
MOVEM (移动 多 个 寄存 器 ) ，307 
80286，266 
8086， 
CPU (中 央 处 理 器 ) ，267 
instruction set summary (指令 集 总 结 ) ，282 


A 


A/D conversion (A/D 转换)，333, 336 
dual slop ( 双 和 斜率 ) ，336 
flash conversion ( 快 闪 转换 ) ，336 
single slope (〈 单 斜率 ) ，336 
successive approximation (逐步 逼近 )，336 
voltage to frequency (电压 到 频率 )，336 
ABEL programming language (ABEL 编 程 语言 ) ，419， 
422 
abort mode (异常 中 止 模式 )，300, 301 
absolute addresses (绝对 地 址 ) ，175 
absolute references (绝对 引用 ) ，229 
abstraction levels (抽象 级 别 ) ，4 
application programming interfaces (应 用 编程 接口 )，5 
arithmetic and logic unit (ALU) (算术 和 逻辑 单元 ) ，5$ 
accumulator (累加 器 ) ，269 
Actel, 426 
active (活跃 的 )，77 
addressable memory (可 寻 址 存储 器 )，135 
addressing modes ( 寻 址 模式 )，171, 202, 304 
address bus (地 址 总 线 )，125 
address decoder (地 址 译 码 器 ) ，128 
address latch enable (地 址 锁 存 使 能 )，268 
address modes (地 址 模式 )，171 
address registers (地 址 寄存 器 )， 
a0...a6 (68K 处 理 器 的 地 址 寄存 器 )，172 
direct (直接 ) ，175 
indirect (间接 ) 175 
direct addressing (直接 寻 址 )，208 
indirect addressing (间接 守 址 )，204 
indirect with postincrement or predecrement ( 带 后 递 


增 或 前 递增 的 间接 寻 址 ) ，208 


5| 


address space 地址 空间 ) ，136 
address strobe (地 址 选 通 ) ，258 
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instruction (指令 )，129 
program (程序 )，170 
programming (编程 ， 程 序 设计 )，159, 193 
programming the 8086 architecture (8086 体 系 结构 编 
程 )，289 
source file ( 源 文 件 )，168 
assert ( 置 为 有 效 )，53 
asserted (被 置 为 有 效 )，77 
associative cache ( 相 联 cache)，378, 381 
Associative Laws (结合 律 )，51 
Associative law for AND (AND 的 结合 律 )，51 
Associative law for OR (OR 的 结合 律 )，51 
asynchronous (异步 ),， 71 
auto-incrementing (自动 递增 }，206, 212 
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auxjliary field (Aux) (辅助 域 ) ，280 
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banding (将 数据 位 转换 为 激光 调制 光束 的 过 程 )，401 
bank switch (存储 体 切 换 )，300 
barrel shifter ( 桶 式 移 位 器 ) ，302 

ASR (算术 右 移 ) ，303 

LSL (逻辑 左 移 ) ，303 

LSR (逻辑 右 移 ) ，303 

operations (操作 ) ，303 

ROR (循环 右 移 ) ，303 

RRX (扩展 的 循环 右 移 ) ，303 
based indexed mode ( 基 址 变 址 模式 ) ，277 

with displacement ( 带 位 移 的 )，277 
based mode 〈 基 址 模式 ) ，276 
bases (基数 )，18 

base 2 (基数 2)，18 

base 8 (基数 8)，18 

base 10 (基数 10)，18 

base 16 (基数 16)，18 

binary (二 进 制 )，18 

decimal (十 进 制 )，18 

hexadecimal (十 六 进 制 )，18 

octal (八进制 ) ，18 

radix (基数 )，18 
basic block (基本 模块 )，369 
BCD (二 进 制 编码 的 十 进 制 数 )，24 
benchmarks (测试 基准 )，11, 397 

SPECbase_int92, 11 

SPECint95, 11 
big Endian (高 端 字 节 序 ) ，165 
binary (二 进 制 )，18 


binary-coded decimal (BCD) (二 进 制 编码 的 十 进 制 ) ，24 


instructions (指令 )，239 
binary bits (二 进 制 位 )，23 
bit (位 )，23 
byte ( 字 节 )，23 
double word ( 双 字 )，23 
long word (长 字 )，23 
nibble ( 半 字 节 )，23 
word ( 字 )，、23 
bit (位 )，23 
bitwise AND ( 按 位 与 )，37 
bit manipulation instructions (位 操作 指令 )，239 
BIU (总 线 接口 单元 ) ，267 
block (模块 )，374 
Boolean algebra (布尔 代数 )，50 
branch (B) (转移 、 分 支 )，210, 317 
analysis (分 析 )，411 
delay slot ( 延 时 权 }，368 
equal (相等 )，174 
instructions (指令 )，317 
Prediction (预测 ) ，364 
target caches (目标 cache)，364 
with link (BL) ( 带 链接 的 转移 )，317 
branching and program control (转移 和 程序 控制 )，200 
buffer (缓冲 器 ) ，33 
burst mode access ( 突 发 模式 访问 ) ，374 
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busses (总 线 ),，5 
AGP, 5 


VXI, 5 
BUS GRANT (总 线 授权 )，153 
bus interface unit (总 线 接口 单元 ) ，267 
bus organization (总 线 组 织 ) ，123 
BUS REQUEST (总 线 请 求 )，153 
bus width (总 线 宽 )，353 
byte ( 字 节 )，23 

addressing ( 寻 址 )，161 

packing (包装 )，161 

selector (选择 线 ) ，162 
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C++，209 
cache (高 速 缓存 ) ， 
hit (命中 )，374 
memory (存储 器 )，378 
organization (组 织 )，376 
types (类 型 )，378 
associative ( 相 联 ) ，378 
direct-mapped (直接 映像 )，378 
sector mapped (区 映像 )，378 
set-associative (组 相 联 )，378 
write strategies ( 写 策略 )，386 
caches (高 速 缓存 ) ，146, 372 
CARRY (进位 标志 位 )，201 
CCR (条 件 码 寄存 器 ) ，174 
char (字符 )，12 
chip enable (CE) (芯片 使 能 ) ，126 
chip select (CS) (芯片 选择 )，126 
CISC (复杂 指令 集 计 算 机 ) ，295, 353, 354 
clock (时 钟 ) ，64 
cycle time (周期 时 间 ) ，362 
skew (偏差 )，432 
speed (速度 )，353 
clocked RS flip-flop (时 钟 触发 的 RS 触发 器 )，73 
clockless computer (无 时 钟 计算 机 )，434 
clocks and pulses (时 钟 和 脉冲 )，62 
CMOS (互补 型 金属 氧化 物 硅 ) ，39 
code segment (CS) register (代码 段 寄 存 器 ) ，274 
coherent (一 致 的 )，376 
combinatorial logic (组 合 逻 辑 }，61 
comment (注释 )，170 
comparator (比较 器 ) ，336 
compilers and assemblers (编译 器 和 汇编 器 ) ，242 
complement ( 补 ， 反 )，33 


complementary metal-oxide silicon (互补 型 金属 氧化 物 


硅 )，39 
complex instruction set (复杂 指令 集 )， 
architecture (体系 结构 )，10 
computer (计算 机 )，295 
computer (CISC) (复杂 指令 集 计算 机 )，354 


complex programmable logic devices (复杂 可 编程 逻辑 


器 件 ) ，424 
compound gates (复合 门 )，34, 35 
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computer-aided design (CAD) software (计算 机 辅助 设计 
软件 )，15, 116 
COM ports (COM 端口 )，81, 82, 330 
conditional execution (条 件 执 行 )，301 
condition code register (CCR) (条 件 码 寄 存 器 )，174 
C BIT (carry bit) (进位 位 )，174 
N BIT (negative bit) (负数 位 )，174 
V BIT (overflow) (溢出 位 )，174 
X BIT (extend bit) (扩展 位 )，174 
Z BIT (zero bit) ( 零 位 )，174 
condition control register (CCR) (条 件 控 制 寄 存 器 ) ，194 
contents addressable memory (可 按 内 容 寻 址 存储 器 ) ，382 
converting (转换 )， 
decimals to bases (十 进 制 转 换 为 其 他 基数 )，25 
numbers ( 数 )，20 
core ( 核 )，296 
memories ( 磁 心 存储 器 )，131 
coverage testing 《覆盖 测试 ) ，411 
CPLD (复杂 可 编程 逻辑 器 件 ) ，424 
CPU16 (原始 的 68K 核 ) ，296 
CPU32 (全 32 位 68K 核 )，296 
CRE option (CRE 选 项 ) ，185 
cross-point Switches (交叉 点 开关 ) ，421 
current program status register (CPSR) (当前 程序 状态 寄 
存 器 ) ，298 
current sources (电流 源 )，341 
cylinder ( 柱 面 )，9 
Cand C++, 210, 229, 328 
C BIT (carry bit) (进位 位 )，174, 299 


D 


D/A conversion (D/A 转换 )，333 
data abort (数据 异常 中 断 )，319 
data bus (数据 总 线 )，125 
data bus width (数据 总 线 宽 )，135 
data direction register (数据 方向 寄存 器 )，329 
Data MO Corporation (数据 MO 公司 ) ，422 
data processing instructions (数据 处 理 指令 )，310 
data register direct (数据 寄存 器 直接 )，175 
data segment (DS) register (数据 段 寄 存 器 ) ，274 
data storage directives (数据 存储 伪 指 令 )，184 
DC (define constant) (定义 常量 )，184 
DCB (define constant block) (定义 常量 块 )，185 
DS (define storage) (定义 存储 )，185 
CRE option (CRE 选 项 ) ，185 
OPT (set options) ( 置 可 选项 ) ，185 
data transfer instructions (数据 传输 指令 )，238, 282 
DBcc Instruction (DBcc 指 令 )，215 
DCB (define constant block) (定义 常量 块 )，185 
DC (define constant) (定义 常量 )，184 
DDR ( 双 数 据 速 率 ) ，147 
decimal (十 进 制 ) ，18 
decimal add adjust (十 进 制 加 调整 )，24 
decode stage ( 译 码 阶段 )，359 
DEC VAX (DEC 公 司 的 VAX 计 算 机 )，387 
defect tojerant ( 容 缺 陷 的 )，428 
defragmented (碎片 整理 )，389 
delayed branches (延迟 的 转移 )，368 
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demand-paged virtual memory ( 按 需 调 页 虚拟 存储 器 )，390 
DeMorgan's Theorems ( 德 摩根 定理 )，52, 166 
destination index (DD register (目的 变 址 寄存 器 ) ，271 
Dhrystone，367 
digital-to-analog (D/A) conversion (数字 到 模拟 转换 ) ，332 
digital-to-analog conversion (数字 到 模拟 转换 ) ，333 
digital logic (数字 有 还 辑 ) ，29 
Digital Research Corporation (数字 研究 公司 ) ，265 
digital signal processor (DSP) (数字 信和 号 处 理 器 ) ，172, 357 
direct-mapped cache (直接 映像 cache) ，376, 378 
directives (命令 )，183 
direct (absolute) addressing (直接 (绝对 ) 寻 址 )，208 
direct memory access (DMA) (直接 存储 器 访问 ) ，152, 301 
direct mode (直接 模式 )，276 
dirty bit 《 脏 位 )，391 
disassembly ( 反 汇 编 )，254 
displacement (位 移 )，195, 201, 280 

too large (过 大 ) ，230 
Distributive Laws (分 配 律 )，51 

First distributive law (第 一 分 配 律 )，51 

Second distributive law (第 二 分 配 律 )，51 
DO/WHILE and FOR loops (DOA/WHILE 和 FOR 循环 )，193 
DO/WHILE, 210 211 
DO/WHILE Loop Construct (DO/WHILE 循 环 结构 )，213 
double ( 双 )，12 
double and quad formats for floating point numbers ( 双 精 

度 和 四 精度 浮 点 数 )，199 

double data rate 〈 双 数据 速率 ) ，147 
double data type ( 双 数 据 类 型 )，198 
double word ( 双 字 )，23 
DRAM (动态 随机 访问 存储 器 ) ，6. 145, 372 
DRAM memory (DRAM 存 储 器 ) ，146 
drivers (驱动 程序 )，4 
DSP (数字 信号 处 理 器 )，353, 354 
DS (define storage) (定义 存储 )，185 
duality (对 偶 性 )，402 
dual slope ( 双 和 斜率 ) ，336 
duty cycle ( 占 空 度 )，66 
dynamic (动态 )， 

memory (存储 器 ) ，143 

branch prediction (转移 预测 ) ，364 

RAM (随机 存储 器 )，145 

random access memory (DRAM) (随机 存储 器 )，6, 372 
dynamic scheduling (动态 调度 )，366 
D flip-flop (D 触 发 器 )，76 


E 


Easy68K，182 

edge-triggered (边沿 触发 的 ) ，77 

EDO DRAM (扩展 数据 输出 DRAM) ，147 
EEMBC (EDN 伐 入 式微 处 理 器 测试 基准 协会 )，406 
effective address (EA) (有 效 地 址 ) ，175, 176, 254 
effective execution time (有 效 执行 时 间 ) ，375 
electromagnetic shielding (电磁 屏蔽 ) ，399 
electromigration 〈( 电 迁移 )，431 

empty ascending ( 空 上 升 ) ，309 

empty descending ( 空 下降 ) ，309 

empty stack ( 空 栈 ) ，309 
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end-of-conversion (转换 结束 ) ，345 

END (end of source file) ( 源 文 件 结束 ) ，183 
engineering notation (工程 符号 ) ，26 

EQU (equate directive) (等 于 的 指令 )，184 
Ethernet (以 太 网 )，5, 81 

evaluation boards (评估 板 )，407 

exceptions (异常 )，323 327 

excitation outputs ( 沿 励 输出 )}，107 
EXTENDED (扩展 位 )，201 

extended data out (扩展 数据 输出 )，147 
extra segment (ES) register (扩展 段 寄 存 器 )，274 


EF 


falling edge (下 降 沿 )，32 
fall time (下 降 时 间 )，63 
fast interrupt request mode (快速 中 断 请 求 模 式 )，301 ， 
319 
feedback (反馈 )},，71 
fetch ( 取 )，176 
fetch stage ( 取 指 令 阶 段 )，359 
field programmable gate array (现场 可 编程 门 阵列 )， 
419, 424 
finite state machine (有 限 状 态 机 )，96 
Firewire (一 种 总 线 ) ，5, 81 
first-in, first-out (FIFO) (先进 先 出 )，267 
flags (标志 )，174, 201 
CARRY (进位 )，201， 
EXTENDED (扩展 )，201 
NEGATIVE (负数 ) ，201 
OVEREFLOW (溢出 )，201 
ZERO ( 零 )，201 
flags field (标志 域 )，299 
C bit (进位 位 )，299 
N bit (负数 位 )，299 
VV bit (溢出 位 )，299 
Zbit ( 零 位 )，299 _ 
flag registers (标志 寄存 器 )，272 
Bit 0: Carry Flag (CF) (位 0: 进位 标志 )，272 
Bit 2: Parity Flag (PF) (位 2， 奇偶 标志 )，272 
Bit 4: Auxiliary Carry (AF) (位 4: 辅助 进位 )，272 
Bit 6: Zero Flag (ZF) (位 6: 零 标 志 ) ，272 
Bit 7: Sign Flag (SF) (位 7， 符号 标志 )，272 
Bit 8: Trace Flag (TF) (位 8， 陷 阱 标志 )，272 
Bit 9: Interrupt-Enable Flag (IF) (位 9: 中 断 使 能 标志 )， 
273 
Bit 10: Direction Flag (DF) (位 10; 方向 标志 )，273 
Bit 11: Overflow Falg (OF) (位 11: 溢出 标志 )，273 
flash A/D converter ( 快 办 AD 转换 器 ) ，339 
flash conversion ( 快 闪 转换 ) ，336 
flip-flop 〈 触 发 器 ) ，72 
D flip-flop (D 触 发 器 ) ，76 
JK flip-flop (IK 触发 器 )，73 
RS flip-flop (RS 触发 器 ) ，72 
toggling (翻转 )，72 
float ( 浮 点 数 ) ，12, 24, 198 
floating point ( 浮 点 )， 
number ( 数 )，24 
units (单元 )，199 


flowthrough time ( 流 经 时 间 )，362 

flow charting (流程 绘制 )，181 

flush (清空 ) ，360 

FOR 【FOR 语句 )，210 

FOR loop (FOR 循环 )，210 

FOR loop construct (FOR 循环 结构 ) ，214 
FPGA (现场 可 编程 门 阵列 )，424 

FPUs ( 浮 点 单元 )，199 

frame pointer ( 帧 指针 )，272 

frequency (频率 )，66 

fully associative cache (全 关联 cache)，381 
full ascending ( 满 上 升 )，308 

full descending ( 满 下 降 ) ，309 

full stack (〈 满 堆栈 ) ，308 


G 


Gary Kidall, 265 

general registers (通用 寄存 器 )，172 
eight data registers, DO...D7 (8 个 数据 寄存 器 D0..D7)，172 
seven address registers, A0...A6 (7 个 地 址 寄存 器 

A0..A6)，172 

stack pointers (堆栈 指针 )，172 

George Boole (乔治 : 布尔 )，50 

giga ( 吉 )，8,27 

Gordon Moore ( 戈 登 . 摩尔 )，2 


H 


handshake (握手 )， 
control (控制 )，433 
process (进程 )，153 
hardware accelerators (硬件 加 速 器 }，426 
hardware architecture (硬件 体系 结构 )，1 
hardware description language (硬件 描述 语言 )，2 
Harvard architecture (哈佛 体系 结构 )，11, 355, 297 
hazards ( 突 险 情况 ) ，360 
HDL (硬件 描述 语言 )，2 
head (磁头 )，9 
Heinrich Rudolf Hertz, 65 
Hertz (赫兹 )，65S 
heterogeneous ( 异 构 型 的 )，149 
hexadecimal (十 六 进 制 )，18 
hextant (一 种 交叉 互 连 接 结构 )，427 
Hi-Z (高 阻抗 )，29 
homogeneous bus ( 同 构 型 总 线 )，149 
hot boards ( 热 板 )，407 
Howard Aiken, 11,355 


LO ports (MO 端口 )，328 
IBM PC-XT, 265 

IEEE-754, 199 

IEEE488, 81 

IEEE Standard 1364-1995, 116 
IF, 210 

IF/ELSE, 210 

IF statement (IF 语 句 )，198 
immediate (立即 )，280 
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address mode 【地址 模式 ) ，176 
operand mode 〈 操 作 数 模式 ) ，275 
impedance (阻抗 ) ，29 
incrementer (递增 器 ) ，298 
index addressing mode ( 变 址 寻 址 模式 )，305 
Preindex without write back (不 写 回 的 前 变 址 )，305 
preindex with write back 〈 带 写 回 的 前 变 址 ) ，305 
post index with write back ( 带 写 回 的 后 变 址 )，305 
index mode ( 变 址 模式 )，276, 305 
DS: MOYV [DI+4], AL, 277 
indirect addressing (间接 寻 址 )，175, 328 
instruction (指令 )， 
pointer (ip) (指针 )，273 
prefixes (前 级 )，278 
set ( 集 )，167, 171 
set architecture (isa) (集体 系 结构 )，108, 159, 354 
set simulator (iss) ( 集 模拟 器 )，182 
instrumenting (加 检测 }，410 
int (整数 )，12 
integrated design environments (ide) (集成 设计 环境 )，182 
intellectual property (知识 产权 )，296 
Intel x86 processor (Intel X86 处 理 器 )，159 
interface (接口 )，322 
interrupts 〈 中 新 )，323 
controller (控制 器 ) ，259 
request mode (请 求 模式 )，301, 300 
service routine (isr) (中 断 服 务 程序 )，323 
intersegment jump (7 段 间 跳 转 )，288 
intrasegment jump ( 段 内 跳 转 )，288 
JP 【知识 产权 )，296 
ISA (指令 集体 系 结构 )，5, 108 


J 


JK flip-flop (JK 触 发 器 }，74 
John von Neumann (约翰 . 冯 : 诺 依 曼 )，355 
JSR ( 跳 转 到 子 程序 )，216 
jump ( 跳 转 )，210 
to subroutine (JSR) ( 跳 转 到 子 程序 )，210, 216 


K 


K-map (K- 图 )，55 
Karnaugh map ( 卡 诺 图 )，55 
kilo {( 千 )，8,27 


人 


L1 cache (初级 cache)，7,373 

L2 cache (二 级 cache)，7, 373 

label (标号 ) ，170 

last in, first out (LIFO) (后 进 先 出 ) ，308 

latency (潜伏 期 ) ，309 

Laws of Absorption (吸收 律 )，52 
First law of absorption (第 一 吸收 律 ) ，52 
Second law of absorption (第 二 吸收 律 )，52 

Laws of Commutation (交换 律 )，51 
Commutation law for AND (AND 交 换 律 )，51 
Commutation law for OR ( O R 交 换 律 )，51 

Laws of Complementation (互补 律 )，51 
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First law of complementation (第 一 互补 律 )，51 
Second Iaw of complementation (第 二 互补 律 )，51 
Third law of complementation (第 三 互补 律 )，51 
Law of double complementation (双重 互补 律 )，51 
Laws of Tautology ( 重 言 律 )，51 
First law of tautology (第 一 重 言 律 )，51 
Second law of tautology (第 二 重 言 律 )，51 
Law of Tautology with Constants ( 带 常数 的 重 言 律 )，52 
LDM ( 装 入 多 个 寄存 器 ) ，307 
least recently used (LRU) (最 近 最 少 使 用 的 ) ，382 
least significant digit (最 低 有 效 位 )，18 
level 1 (1 级 ), 7 
level 2 (2 级 ), 7 
linear address space (线性 地 址 空间 )，139 
linear amplifiers (线性 放大 器 )，12 
listfile (列表 文件 )，182 
literal (immediate) addressing (文字 (立即) 寻 址 )， 
207 
little Endian ( 低 端 字 节 序 )，165 
load-use penalty ( 装 人 -使 用 惩罚 ) ，368 
load/store 〈 装 入 /存储 ) ，298 
instructions (指令 )，312 
loads ( 装 入 )，298 
load effective address (lea) ( 装 人 有 效 地 址 )，212, 219 
locality (局 部 性 )，374 
of reference (引用 的 ) ，374 
local clocks (局 部 有 时钟) ，432 
logical and shift instructions (逻辑 和 移 位 指令 ) ，239 
logical equation (逻辑 方程 ) ，17 
logical instructions (逻辑 指令 ) ，233 
AND (与 )，233 
ANDI (与 立即 数 ) ，234 
EOR ( 异 或 )，234 
EORI ( 蜡 或 立即 数 )，234 
OR (或 )，234 
ORI (或 立即 数 ) ，234 
NOT ( 反 )，234 
logical memory (逻辑 存储 器 ) ，388 
logical memory space (逻辑 存储 空间 ) ，388 
logic analyzer (逻辑 分 析 仪 ) ，409 
logic instructions (逻辑 指令 )，284 
longs or long words (长 字 )，23, 167 
LOW ( 低 )，77 
low-power Schottky ( 低 功 耗 肖 特 基 )，39 
lower data strobe ( 低 数 据 选 通 ) ，165 
LSL (逻辑 左 移 )，303 
LSR (逻辑 右 移 )，303 


M 


machine language (机 器 语言 ) 
code (代码 )，168 
instructions (指令 )，168 
Mars Rover (火星 探测 器 ) ，326 
mask (屏蔽 )，325, 326 
master-slave ( 主 从 )，75 
Mead and Conway，2 
Mealy machine (Mealy 机 )，97 
measuring performance (度量 性 能 )，404 
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mega ( 百 万 )，8, 27 
memory (存储 器 ) ，60 
addressing modes ( 寻 址 模式 )，275 
design (设计 )，123 
hierarchy (层次 )，7, 373 
Level 1, or L1 cache (初级 cache)，7 
Level 2, or L2 cache (二 级 cache), 7 
leaks (泄漏 )，411 
management unit (管理 单元 )，388 
models (模型 )，289, 290 
tiny ( 微 )，290 
small (小 ) ，290 
medium (中 )，290 
compact 《紧凑 ) ，290 
large (大 )，290 
huge ( 巨 )，290 
organization (组 织 )，159, 162 
storage conventions (存储 规约 ) ，160 
System design (系统 设计 )，131 
microcode ( 微 代 码 )，61, 108 
microcontrollers ( 微 控制 器 )，296 
microseconds ( 微 秒 )，26 
millions of instructions per second (每 秒 运行 的 百 万 指令 
数 )，406 
MIPS (每 秒 运行 的 百 万 指令 数 )，406 
benchmark (测试 基准 )，406 
MMU (存储 管理 单元 ) ，388 
mnemonics ( 助 记 法 )，169 
mod (修饰 符 )，279 
Mode 0: Data Register Direct (模式 0: 数据 寄存 器 直接 


寻 址 )，203 

Mode 1: Address Register Direct (模式 1: 地 址 寄存 器 直 
接 寻 址 )，203 

Mode 2: Address Register Indirect (模式 2: 地 址 寄存 器 
间接 寻 址 )，203 


Mode 3: Address Register Indirect with Postincrement ( 模 
式 3; 带 后 递增 的 地 址 寄存 器 间接 寻 址 )，206 

Mode 4: Address Register Indirect with Predecrement ( 模 
式 4; 带 前 递减 的 地 址 寄存 器 间接 寻 址 ) ，206 

Mode 5: Address Register Indirect with Displacement ( 模 
式 5; 带 位 移 的 地 址 寄存 器 间接 寻 址 )，230 

Mode 6: Address Register Indirect with Index (模式 6: 
带 变 址 的 地 址 寄存 器 间接 寻 址 )，230 

Mode 7, Subclass 000: Absolute Addressing (Word) ( 模 
式 7， 子 类 000: 字 绝 对 寻 址 )，205 

Mode 7, Subclass 001: Absolute Addressing (Long) ( 模 
式 7， 子 类 001: 长 字 绝对 寻 址 ) ，205 

Mode 7, Subclass 2: Program Counter with Displacement 
(模式 7, 子 类 2: 带 位 移 的 程序 计数 器 ) ，231 

Mode 7, Subclass 3: Program Counter with Index (模式 7， 
子 类 3: 带 变 址 的 程序 计数 器 ) ，232 

Mode 7, Subclass 4: Immediate Addressing (模式 7， 子 
类 4: 立即 寻 址 )，205 

mode field (模式 域 )，176 

mod(modifier) field (修饰 符 域 ) ，279 

Molecular Computing (分 子 计算 }，430 

Moore's Law (摩尔 定律 )，2 

Moore machine (Moore 机 )，97 

MOSFET (金属 氧化 物 半 导体 场 效应 晶体 管 )，41, 72 
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most significant digit (最 高 有 效 位 )，18 
Motorola,148 
Motorola 68000 processor .(Motorola 68000 处 理 器 ) ，159 
MOVEA (移动 地 址 ) ，233 
MOVEM (移动 多 个 寄存 器 ) ，217, 233 
MOVE instructions (移动 指令 ) ，233 

MOVEA (移动 地 址 ) ，233 

MOVEM (移动 多 个 寄存 器 ) ，233 
move not (MVN) instruction (移动 取 反 指令 )，304 
multiplexer (多 路 选择 器 )，125, 267 
multiply-accumulate (MAC) unit (乘法 ~ 累加 单元 )，297 
MUX (多 路 选择 器 )，125, 267 


N 


negation ( 非 ) ，33 
negation bubble (表示 “ 非 ” 的 小 圆圈 )，34 
NEGATIVE (负数 )，201 
negative logic 〈 负 逻辑 ) ，53 
negative numbers (负数 ) ，194 
negative pulse 〈 负 脉冲 ) ，62 
nibble ( 半 字 节 )，23 
Nintendo Game Boy (任天堂 GameBoy 游 戏 机 )，1 
nonaligned access 《 非 对 齐 访问 )，161 
nonmaskable interrupt (NMI) (不 可 屏蔽 中 断 ) ，327 
nonvolatile read-only memory (ROM) ( 非 易 失 性 只 读 存 
储 器 ) ，372 
NOP (不 做 任何 事 的 指令 )，169, 176 
NOT ( 非 )，29 
NOT instruction ( 取 反 指令 ) ，234 
number systems ( 数 制 ) ，12 
char (字符 )，12 
int (整数 }，12 
float 〈 浮 点 数 ) ，12 
double 〈 双 精度 浮 点 数 ) ，12 
numeric representations (数值 表示 ) ，193 
N BIT (negative bit) (负数 位 ) ，174, 299 


O 


octal (八进制 )，18 
offset ( 偏 移 ) ，291 
offset value ( 偏 移 值 )，201 
Ohm’s Law (欧姆 定律 )，338 
one-time programmable (一 次 性 可 编程 )，421 
one to N (1 到 N), 123 
opcode (操作 代码 )，169, 170, 183, 279 
word ( 字 )，254 
open collector 〈 开 集 电极 ) ，420 
open drain ( 开 漏 极 ) ，420 
operands (操作 数 ) ，170 
address (地 址 )，279 
size (大 小 )，303 
OPT (set options) ( 置 可 选项 )，185 
OR (或 )，29 
ORG (set origin) ( 置 初 始 值 )，183 
orthogonal { 正 交 的 )，297 
oscillator (振动 器 )，89 
oscilloscope (示波器 )，63 
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OTP (一 次 性 可 编程 )，421 
out-of-range error (越界 错误 ) ，230 
output enable (OE) 〈 输 出 使 能 ) ，126 
overclocking (超频 )，402 
OVERFLOW (溢出 )，201 


P 


page-table base register (页 表 基 址 寄存 器 ) ，391 
pages (页 ) ，389 
page (页 )， 
fault (故障 )，390 
frames ( 帧 )，390 
frame number ( 帧 号 ) ，391 
map (映像 )，391 
number (号 )，137 
offset ( 偏 移 } ，137 
table ( 表 )，391 
table entries ( 表 和 人口)，391 
paging (分 页 )，137 
PAL (可 编程 阵列 逻辑 ) ，419 
PALEs 〈 可 编程 原子 逻辑 元 件 ) ，427 
paragraphs ( 段 )，273 
parallel port, LPT (并 行 端口 ，LPT)，81 
PC-105, 5 
PCI, 5 
PCI bus (PCI 总 线 ) ，81 
PC relative (PC 相对 ) ，231 
performance issues (性 能 问题 )，397 
period (周期 )，64, 66 
phase lock ( 锁 相 ) ，402 
phase-locked loop (PLL)( 锁 相 环 ) ，402, 432 
pipelining (流水 线 )，358 
plasma (可 编程 逻辑 和 开关 算 阵 )，427 
polling ( 轮 询 ) ，324 
loop (循环 ) ，324 
positive logic ( 正 逻 辑 )，34, 52 
positive pulse 〈 正 脉冲 ) ，62 
postindex with write back 〈 带 写 回 的 后 变 址 ) ，305 
prefetch abort ( 预 取 异常 中 断 ) ，319 
preindex (前 变 址 )， 
with write back ( 带 写 右 和 的 )，305 
without write back (不 写 回 的 )，305 
priority encoder 〔 优 先 级 编 公 ) ，340 
priority inversion (优先 级 颠倒 ) ，326 
privileged instructions (特权 指令 )， 239 
processor architectures (处 理 器 体系 结构 )，354 
processor modes (处 理 器 模式 )，300 
abort mode (异常 中 止 模式 )，301 
fast interrupt request mode (快速 中 断 请 求 模式 ) ，301 
interrupt request mode (中 断 请 求 模式 )，301 
supervisor mode (管理 模式 )。301 
system mode (系统 模式 )，300 
undefined mode (未 定义 模式 )，301 
user mode (用户 模式 ) ，300 
processor status register (处 理 器 状态 寄存 器 ) ，299 
programmable array logic (可 编程 阵列 逻辑 )，419 
programmer's model (程序 员 模 型 )，171, 173 
Programmer's Reference Manual (程序 员 参 考 手 册 ) ，178 
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program control instructions (程序 控制 指令 )，239 

program counter (程序 计数 器 )，172 

program counter register (程序 计数 器 寄存 器 ) ，328 

program status register instructions (程序 状态 寄存 器 指 

令 )，318 

propagation delay (传播 延 时 ) ，32, 63 

protected mode (保护 模式 )，266 

protection bits (保护 位 )，391 

pseudo-ops ( 伪 操 作 代 码 )，183 

pseudo opcodes ( 伪 操 作 代 码 )，183 
END (end of source file)( 源 文件 结束 )，183 
EQU (equate directive) (相等 伪 指 令 )，184 
ORG (set origin) ( 置 起 始 位 置 ) ，183 
SET (set symbol) ( 置 符号 ) ，183 

pull-up resistor (上 拉 电 阻 )，421 

pulse width (脉冲 宽度 ) ，62 

push and pop 〈 压 人 和 弹出 、 压 栈 和 退 栈 ) ，308 


R 


r13: stack pointer (堆栈 指针 ) ，298 
r14: link register (链接 寄存 器 ) ，298 
I15: program counter (程序 计数 器 ) ，298 
race condition (竞争 条 件 )，74, 75, 89 
radio frequency interference (RFI) (射频 干扰 )，399 
radix (基数 )，18 
radix complement ( 基 补 码 )，195 
RAM (随机 访问 存储 器 ) ，131 
random access memory (随机 访问 存储 器 )，131 
rasterization 《光栅 化 )，95 
real-time (实时 )， 
operating systems (操作 系统 ) ，325 
trace 〈 跟 踪 ) ，411 
real numbers (实数 ) ，194, 198 
real world (真实 世界 ) ，322 
reconfigurable (可 重 构 的 )， 
computing (计算 )，424 
hardware (硬件 )，419 . 
reduced instruction set computer, RISC (精简 指令 集 计 算 - 
机 )，240, 295, 355 
refill line ( 重 充 线 )，378 
refresh cycle (刷新 周期 )，145 
register/memory (R/M) (寄存 器 /存储 器 ) ，279 
register (寄存 器 ) ，212 
and immediate (和 立即 数 ) ，304 
D0...D7, 172 
direct addressing (直接 寻 址 )，203, 207 
field ( 域 ) ，176 
file (文件 )，297 
indirect mode (间接 模式 ) ，276 
maps (图 )，329 
operand mode (操作 数 模 式 )，275 
relocatable (可 重 定 位 的 )，229 
Rent's Rule (Rent 规 则 )，427 
RESET (复位 )，81, 82, 324 
resistor (电阻 )，339 
return (返回 ) ，218 
return from subroutine (RTS) (从 子 程序 返回 )，217 
ripple counter ( 行 波 计 数 器 ) ，81 
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RISC (精简 指令 集 计 算 机 )，295, 353, 354, 355 

RISC processors (RISC 处 理 器 ) ，368 

rise time (上 升 时 间 )，63 

rising edge (上 升 沿 )，32 

ROM (只 读 存储 器 ) ，372 

ROR (循环 右 移 ) ，303 

RRX (扩展 的 循环 右 移 )，303 

RS-232, 81 

RS flip-flop (RS 触发 器 ) ，72 
clocked RS flip-flop (时 钟 触发 的 RS 触发 器 ) ，73 
state dependency (状态 依赖 )，73 

RTOS (实时 操作 系统 )，325 


S 


S/H (采样 和 保持 )，344 
sample and hold module (采样 和 保持 模块 )，344 
saved program status register (spsr) (程序 状态 保存 寄存 
器 )，298 
SBZ (应 为 零 )，311 
schematic diagrams (示意 图 )，16 
SDRAM memory (SDRAM 存 储 器 )，143, 146 
sector-mapped cache (区 映像 cache)，383 
sectors (rows) (区 ( 行 ))，383 
segment: offset ( 段 : 偏 移 ) ，280 
segment override prefix ( 段 超越 前 级 )，278 
segment registers ( 段 寄 存 器 )，267, 273, 274 
code segment (CS) (代码 段 )，274 
data segment (DS) (数据 段 );，274 
stack segment (SS) (堆栈 段 )，274 
extra segment (ES) (扩展 段 )，274 
self-modifying code (自修 改 代码 )，355 
set-associative cache (组 相 联 cache)，382 
SET (set symbol) ( 置 符号 )，184 
Shakespeare circuit (莎士比亚 电路 ) ，44 
shift and rotate instruction ( 移 位 和 循环 移 位 指令 )，234 
shift register ( 移 位 寄存 器 )，81 
signature analysis (标记 分 析 ) 、429 
sign bit (符号 位 )，195 
sign extended (符号 扩展 的 )，231 
sign extended address (符号 扩展 的 地 址 )，205 
silicon compilation ( 硅 编 译 )，2, 116 
silicon compilers 〈 硅 编译 器 ) ，116 
Silicon Valley (硅谷 )，1 
SIMM，6 
single-ramp ( 单 坡 )，342 
single slope ( 单 斜率 ) ，336 
software interrupt instructions (软件 中 断 指令 )，317 
SP (堆栈 指针 )，211 
spatial locality (空间 局 部 性 ) ，374 
SPECbase_int92, 11 
SPECint92, 11 
SPECint95, 11 
speculative execution (投机 执行 )，366 
SRAM (静态 随机 存储 器 ) ，6, 372 
stack (堆栈 )，211 
and subroutines (和 子 程序 )，216 
implementation options (实现 的 选项 ) ，308 
full ascending ( 满 上 升 )，308 
full descending ( 满 下 降 )，309 








empty ascending ( 空 上 升 ) ，309 
empty descending ( 空 下 降 )，309 
operations (操作 ) ，306 
LDM ( 装 入 多 个 寄存 器 ) ，307 
STM (存储 多 个 寄存 器 ) ，307 
pointer (指针 ) ，172 
segment (SS) register ( 段 寄 存 器 ) ，274 
standard cells (标准 单元 )，346 
standard memory module (SIMM) (标准 存储 模块 )，6 
Standard Performance Evaluation Corporation (标准 性 能 
评估 公司 )，404 
state dependency (状态 依赖 ) ，73 
state machine (状态 机 )，61, 84, 95-118 
state transition diagram (状态 迁移 图 )，84 
static (静态 的 )， 
memory (存储 器 )，143 
RAM (SRAM) (随机 存储 器 ) ，6, 145 
random access memory (SRAM) (随机 存储 器 )，6, 372 
status bus (状态 总 线 )，125 
status register (状态 寄存 器 ) ，173 
STM (存储 多 个 寄存 器 ) ，307 
storage register (存储 寄存 器 ) ，83 
stored charge (存储 电荷 )，145 
stores (存储 )，298 
string manipulation (字符 串 操作 )，285 
successive approximation (逐步 逼近 )，336, 343 
superscalar architecture (超标 量 体 系 结 构 )，356 
supervisor mode 【管理 模式 )，216, 300, 301 
supervisor stack pointer (管理 堆栈 指针 )，216 
SWITCH (开关 转移 ) ，210 
Synchronous dynamic random access memory (同步 动态 
”随机 存储 器 )，143 
system-on-silicon ( 硅 上 系统 )，296 
system interface bus (SCSI) (系统 接口 总 线 )，5 
system mode (系统 模式 )，300 
system vectors (系统 向 量 )，291, 328 


T 


tag (标签 ) ，377 

tag memory (标签 存储 器 ) ，378 

Teesside assembler (Teesside 编 译 器 ) ，182 
Temporal locality (时 间 局 部 性 ) ，374 

tera ( 太 )，8 

Teramac，428 

text editor (文本 编辑 器 ) ，168 
three-terminal device (三 端 装置 )，18 
throughput (吞吐 量 }，362 

thumb mode bit (thumb 模 式 位 )，299 

time critical (时 间 关 键 的 )，405 

time sensitive (时 间 敏 感 的 )，405 

timing diagram (时 序 图 )，77 

toggling (翻转 ) ，72 

translation lookaside buffer (TLB) (转换 变 路 缓冲 器 ) ，391 
TRAP #15 instruction (TRAP #15 指 令 )，240 
TRAP instructions (TRAP 指 令 )，200 
tri-state (TS) (三 态 ) ，29 

TRUE or FALSE ( 真 或 假 )，16 

truth tables ( 真 值 表 )，35, 4 

two’s complement ( 补 码 ) ，195 
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U 


UART (通用 异步 接收 器 /发 送 器 ) ，330 
undefined mode (未 定义 模式 )，300, 301 


universal asynchronous receiver/transmitter (通用 异步 接 


收 器 /发 送 器 ) ，330 

universal serial bus (USB) (通用 串 行 总 线 )，5 
upper data strobe (高 数据 选 通 ) ，165 
USB (通用 串 行 总 线 )，81 
user mode (用 户 模式 )，216, 298, 300, 392 

r13: stack pointer (堆栈 指针 )，298 

r14: link register (链接 寄存 器 ) ，298 

r15: program counter (程序 计数 器 ) ，298 
user stack pointer 〈 用 户 堆栈 指针 ) ，216 


V 


validity bit (有 效 位 )，383, 391 
vectors (向 量 )，327 
Verilog, 2 
very large scale integration (超大 规模 集成 )，115 
VHDL, 2 
vias ( 通 孔 ) ，16 
virtual (虚拟 )， 
address (地 址 )，387, 388 
extension (扩展 )，387 
memory (存储 器 )，372, 387 
page number (页 号 )，390, 391 
VLSI (超大 规模 集成 )，115 
volatile ( 易 失 性 )，330 
voltage divider (分 压 器 )，339 
voltage to frequency (电压 到 频率 )，336 


过 





von Neumann architecture 〈 汉 . 诺 依 蝇 体 系 结构 )，355 


von Neumann bottleneck (加 诺 依 曼 瓶颈 )，355 
VxXI, 5 

V bit {溢出 标志 位 )，299 

V BIT (overflow)( 洲 出 位 )，174 


W 


-wait state 〈 等 待 状态 ) ，150 


WHILE，210 
wired-AND ( 线 与 ) ，420 
word ( 字 )，23 

alignment (对 齐 ) ，178 

offset ( 偏 移 ) ，390 
write-around cache ( 绕 写 cache)，386 
write-back cache ( 回 写 cache)，386 
write-through cache ( 通 写 cache)，386 


X 


X86 instruction format (X86 指令 格式 )，278 
Xilinx, 426 
XX BIT (extend bit) (扩展 位 )，174 


Zz 


2Z80, 265 

ZERO ( 零 )，201 

zero flag ( 零 标 志 )，174 

Zilog, Inc.(Zilog 公 司 ) ，265- 

Z BIT (zero bit) 〈( 霉 位 )，174, 299 


